Halo teman baik TanyaTekno, bertemu kembali kita di artikel ini. Di artikel ini saya dapat membicarakan Cloudera Memperluas Keuntungan Open Data Lake Building ke Hybrid Cloud
Dalam konteks: Dengan jenis fokus yang sebagian besar organisasi tempatkan pada sisi aplikasi transformasi digital, mudah untuk melupakan peran penting yang dimainkan data dalam upaya ini. Ya, pindah ke aplikasi berbasis container dan berbasis cloud—baik yang dihosting di cloud publik atau privat—sangat penting, tetapi begitu juga proyek pengorganisasian dan analisis sejumlah besar data yang dibuat atau diakses oleh sebagian besar organisasi. Secara khusus, kebutuhan untuk mendukung portabilitas data dan alat analisis di berbagai cloud publik dan privat – model “hybrid cloud” klasik kini menjadi semakin penting.
Komponen penting dari pekerjaan ini melibatkan penentuan cara terbaik untuk memanfaatkan aset data yang tersedia. Baru-baru ini, banyak perusahaan mulai memikirkan gagasan yang oleh banyak orang disebut danau data. Sesuai dengan namanya, data lake menggabungkan beberapa karakteristik data lake dan data warehouse menjadi satu kesatuan.
Data lake biasanya berisi sejumlah besar data tidak terstruktur dan semi terstruktur yang terdiri dari teks, gambar, audio, video, dll., yang digunakan untuk mengumpulkan kelompok informasi tentang proses atau topik tertentu. Di sisi lain, gudang data umumnya terdiri dari data terstruktur yang diatur ke dalam tabel angka, nilai, dll., Dan digunakan dalam tipe tradisional tipe kueri basis data.
Gudang data lake memperluas fleksibilitas dan skalabilitas data yang Anda simpan dengan memungkinkan Anda menggunakan jenis alat analisis canggih yang awalnya dibuat untuk data lake di data lake. Selain itu, ini memungkinkan Anda untuk menggabungkan elemen dari dua jenis struktur data untuk analisis yang lebih kompleks, yang menurut banyak orang sangat berguna untuk aplikasi AI dan pembelajaran mesin.
Pendukung utama dari konsep penyimpanan data lake adalah Cloudera, sebuah perusahaan yang menelusuri beberapa akarnya ke perangkat lunak data besar Hadoop open source yang berfungsi sebagai pendorong utama pertumbuhan data lake. Pada acara Evolve 2022 baru-baru ini di Cloudera, perusahaan meluncurkan beberapa tambahan pada alat Cloudera Data Platform (CDP) intinya yang akan membantu memungkinkan gudang data digunakan di lebih banyak lingkungan.
Perusahaan menyediakan kemampuan untuk memindahkan data dan alat analisis dengan mudah di beberapa cloud publik, termasuk AWS dan Microsoft Azure, serta cloud perusahaan. Cloudera mengacu pada konsep sebagai “data hybrid”, di mana data sekarang mengambil fleksibilitas dan menghindari penguncian yang mulai ditawarkan oleh aplikasi cloud hybrid.
Untuk menghidupkan konsep data hibrida, Cloudera telah mengaktifkan tiga kemampuan baru yang spesifik: Layanan Data Seluler memungkinkan perusahaan untuk memindahkan aplikasi dan layanan analitik yang dibuat untuk kumpulan data tertentu di lingkungan publik dan pribadi yang berbeda tanpa harus mengubah satu baris kode pun. Replikasi Data Aman mentransfer salinan persis dari data yang sama di lingkungan yang berbeda, memastikan bahwa perusahaan dapat mengakses data yang mereka butuhkan untuk menjalankan bisnis tertentu. Akhirnya, Distribusi Data Universal memanfaatkan alat Cloudera DataFlow baru perusahaan untuk menyerap atau mengimpor platform dengan fokus khusus pada aliran data, memungkinkan umpan data langsung untuk diintegrasikan ke dalam alat manajemen data perusahaan perusahaan juga. Seperti sebagian besar aspek solusi Cloudera, DataFlow dibangun di atas alat sumber terbuka, terutama Apache NiFi.
Secara kolektif, ketiga layanan tersebut memberi organisasi semua alat yang mereka butuhkan untuk menjalankan beban kerja analisis data pada berbagai jenis data di berbagai platform dan lokasi fisik. Ini tidak hanya memberi perusahaan fleksibilitas yang telah mereka kembangkan untuk dihargai menggunakan cloud hybrid, tetapi juga membuka peluang baru.
Misalnya, ini juga dapat dimanfaatkan untuk bereksperimen dengan beban kerja analitik di lingkungan yang berbeda untuk lebih memahami akselerasi perangkat keras unik atau manfaat platform yang dapat ditawarkan oleh berbagai cloud (publik atau pribadi). Tujuannya adalah untuk membantu perusahaan membangun struktur data fleksibel yang dapat diperluas ke jenis lingkungan apa pun yang paling cocok untuk proyek atau kumpulan data tertentu.
Seperti yang telah terbukti dengan komputasi awan secara umum, kebutuhan untuk mendukung solusi hybrid dan multi-cloud menjadi penting untuk alat aplikasi modern saat ini. Akibatnya, vendor telah membuat atau bekerja untuk mengaktifkan jenis dukungan fleksibel ini. Oleh karena itu, sangat masuk akal untuk memperluas jenis pendekatan ini ke alat data dan analitik yang sering mendukung aplikasi ini. Dengan ekstensi terbaru Cloudera untuk CDP, ini mengambil langkah penting ke arah itu.
Bob O’Donnell adalah pendiri dan kepala analis TECHnalysis Research, LLC, sebuah perusahaan konsultan teknologi yang menyediakan konsultasi strategis dan layanan riset pasar untuk industri teknologi dan komunitas keuangan profesional. Anda dapat mengikutinya di Twitter penyematan tweet.
Demikianlah pembahasanmengenai Cloudera Memperluas Keuntungan Open Data Lake Building ke Hybrid Cloud
. Jangan Lupa untuk
share artikel ini ya sobat.