Berkaitan dengan data, menemukan berbagai pola dan mengungkapkan hubungan yang tak terlihat sebelumnya telah menjadi hal penting untuk mencapai kesuksesan bisnis. Organisasi menggunakan lebih banyak data daripada sebelumnya untuk membuat keputusan yang lebih baik dan membuka aliran pendapatan baru berdasarkan data. Oleh karena itu, mampu menangani pertumbuhan data yang sangat besar dan mengekstrak wawasan tepat waktu dari aset yang semakin penting ini, merupakan keharusan strategis bagi perusahaan saat ini dan telah memacu seluruh industri Big Data. Hadoop telah muncul sebagai platform pilihan untuk Big Data Analytics.
Hadoop Distributed File System (HDFS) sebagai sistem file skala-keluar defacto untuk Hadoop telah berfungsi untuk menskalakan penyimpanan dan kebutuhan komputasi untuk beban kerja big data di seluruh perangkat keras komoditas. Namun, seiring dengan skala di luar kisaran petabyte, ekonomi yang terkait dengan penyimpanan dan pengarsipan aset berharga ini telah menjadi perhatian utama industri big data.
Tantangan yang membatasi keseluruhan adopsi dan skalabilitas sistem data big data tradisional meliputi:
- Kebutuhan untuk memindahkan data dari penyimpanan sistem sumber ke cluster HDFS yang mengakibatkan analitik tertunda.
- Meningkatnya biaya operasional dan modal untuk menyimpan salinan data dalam sistem yang berbeda.
- Risiko keamanan terkait dengan data yang berada di luar domain keamanan TI perusahaan.
- Ketidakmampuan untuk menskalakan node penyimpanan terlepas dari komputasi di HDFS, yang menyebabkan biaya resource yang tidak perlu. Khususnya untuk data arsip yang hanya menggunakan penyimpanan dan sedikit atau tanpa sumber daya komputasi.
- Ketergantungan pada replikasi data (faktor 3) untuk perlindungan data dalam skala besar yang meningkatkan biaya penyimpanan data secara keseluruhan.
Sistem penyimpanan berbasis objek mengatasi keterbatasan ini dan merupakan pelengkap yang menarik untuk HDFS yang memberikan opsi terukur dan hemat biaya untuk menangani Big Data.
Cloudera Solutions
Enterprise Data Hub (EDH) Cloudera adalah platform big data modern yang diberdayakan oleh Apache Hadoop sebagai intinya. EDH menyediakan lingkungan sentral yang dapat diskalakan, fleksibel, dan aman untuk menangani beban kerja dari analitik batch, interaktif, hingga real-time. Cloudian HyperStore menyediakan platform penyimpanan perangkat lunak yang memberikan skalabilitas terdepan di industri yang mendukung 100-an petabyte (PB) dengan melalui S3 Restful API, dengan data integritas dan perlindungan.
Solusi single platform untuk aplikasi Big Data yang diskalakan sesuai kebutuhan untuk mendukung lebih banyak beban kerja, lebih banyak pengguna, dan lebih banyak data di semua lokasi. Penampungan Big Data yang dibangun di HyperStore Cloudian yang bekerja pada EDH Cloudera melalui konektor S3A, menyediakan opsi penyimpanan yang ekonomis dan dapat diskalakan, untuk beban kerja Big Data. Ini memungkinkan perusahaan untuk:
- Buat lingkungan penyimpanan Big Data bertingkat di mana hot data dapat berada dalam HDFS dan bisa diakses langsung, sementara HyperStore menyediakan lapisan penyimpanan / arsip untuk warm data.
- Analisis data di tempat tanpa memindahkannya dari sistem sumber ke HDFS
- Skala penyimpanan tidak tergantung pada node komputasi, yang merupakan manfaat penghematan biaya yang sangat besar
- Manfaatkan metadata terkait yang disimpan dalam HyperStore untuk mengakses dan mencari melalui data di bawah arsip
- Gunakan pengkodean penghapusan alih-alih replikasi 3x untuk lapisan HyperStore, dapatkan peningkatan kepadatan penyimpanan dan gandakan kapasitas penyimpanan yang dapat digunakan dibandingkan dengan HDFS tradisional
Selain itu, HyperStore mendukung penyebaran multi-situs untuk perlindungan data dan pemulihan bencana. Replikasi berbasis kebijakan HyperStore memastikan bahwa aset utama secara otomatis disalin dan tersedia di dua atau lebih situs, memberikan contoh failover jika situs utama offline.
Key Solution Benefits
- Penskalaan penyimpanan independen dari resource komputasi yang mahal
- Daya tahan data yang efisien, dengan kode penghapusan – dua kali lipat kapasitas yang dapat digunakan dibandingkan dengan replikasi 3x
- Analisis di tempat langsung dari penyimpanan yang menghasilkan wawasan lebih cepat dan mengurangi biaya infrastruktur
- Dukungan untuk DR otomatis multi-situs dan akses penyimpanan lokal di lokasi terpencil
- Namespace tunggal di seluruh lokasi menghilangkan beban kerja dan kompleksitas manajemen melalui tampilan data yang terpadu
- Interoperabilitas Hybrid dan MultiCloud dengan AWS, Google Cloud Platform, dan Azure.
Cloudera menyajikan platform yang modern untuk machine learning danadvanced analytics dibangun di atas tekonologi open source terbaru. Organisasi mempercayai Cloudera dapat membantu memecahkan masalah bisnis mereka yang paling menantang dengan menyimpan, memproses dan menganalisis data dalam jumlah besar secara efisien.
Segera konsultasikan kebutuhan Big Data Anda dan dapatkan rekomendasi dari pakar IT kami. Hubungi di sini.