Big Data – Data Lake Versus Kebocoran Data
Big Data – Data Lake Versus Kebocoran Data
Peluang dan bahaya Big Data
Data dan gosip memainkan peran yang semakin krusial pada perusahaan serta semakin mewakili faktor produksi yg signifikan. Konsep yg diklaim danau data sangat menjanjikan pada hal analisis data serta info tadi, didukung sang pembelajaran mesin dan kecerdasan sintesis namun, tidak hanya ada keuntungan.
Data serta berita memainkan peran yg semakin krusial pada perusahaan dan semakin mewakili faktor produksi yang signifikan. Konsep yang dianggap danau data sangat menjanjikan pada hal analisis data dan berita tersebut, didukung oleh pembelajaran mesin dan kecerdasan sintesis. namun, tak hanya ada laba.
Keluarnya Big Data serta pengambilan informasi yang bisa diskalakan menggunakan mengandalkan cluster penyimpanan berbasis Lucene, antara lain, sudah menyebabkan kebangkitan teknik analitik. Pelacakan pengetahuan di seluruh perusahaan menjadi mungkin dan poly yg menerima manfaat. Bahwa Anda kini bisa menentukan korelasi antara saat respons penjualan online sangat besar . Anda dapat mengetahui bahwa produktivitas turun ketika waktu henti produksi meningkat dan penundaan khusus mana yg mempunyai akibat ekonomi terbesar di perusahaan penerbangan. Ini merupakan berita usaha berharga yang tidak terlihat kentara dalam data mentah pada jumlah akbar. Pembelajaran mesin sekarang membentuk ini sangat simpel dan , berkat kinerja tinggi dan cakupan volumenya, bisa diterapkan pada sejumlah besar data yang disimpan pada apa yg dikenal menjadi danau data.
Data lake bisa menampung data yg sangat heterogen serta tidak terstruktur. Misalnya termasuk foto, video, email, dokumen Word atau data berasal sistem lain, serta data lain yang tidak terkait. Danau data sangat populer di mana pun ada data sensor pada jumlah besar , contohnya, atau data yg mencatat status perangkat IoT tentang kesehatannya, contohnya. Sebab keragaman data yang wajib dikumpulkan serta digabungkan buat dianalisis, konsep danau data menjadi beredar luas.
Tetapi, data lake pula menyimpan bahaya yang tidak disadari seluruh orang
Mungkin ekornya telah mulai mengibaskan anjingnya. tetapi sebab banyak “data yang dipilih secara strategis” dapat digabungkan menggunakan “algoritme pembelajaran mesin yg dipilih”, ini sudah menciptakan nilai tambah yg cukup besar bagi perusahaan. sang karena itu, lumrah buat menyelami lebih banyak data buat membangun lebih banyak nilai darinya. masalah kebalikannya: kontribusi nilai menurun menggunakan meningkatnya data. Setiap formasi data tambahan tumpang tindih menggunakan berita yang telah diketahui, serta dengan demikian nilai tambah sebagai semakin kecil. tetapi, kabar ini tidak mengakibatkan sebagian akbar perusahaan berhenti mengumpulkan semua data yang mereka dapat berasal berbagai asal sebanyak mungkin. banyak perusahaan berharap pada akhirnya membuat nilai tambah melalui pembelajaran mesin.
Harga memainkan kiprah lain. sebab ruang penyimpanan menjadi sangat murah, kegunaannya bahkan tak diragukan lagi serta tidak ada yang bertanya kejahatan apa yang mungkin dibawanya. Lagi juga, penghapusan selalu menjadi opsi Jika ternyata data tersebut tidak diperlukan. Tetapi, terlepas berasal segala rintangan, kami telah melihat sejumlah besar agresi yg menargetkan kluster penyimpanan ini. berasal agresi brute-force pada kata sandi hingga penyalahgunaan kelemahan software, peretas serta penyerang terus menemukan cara buat masuk ke brankas data perusahaan ini. Semakin banyak data yg terpusat pada satu “lokasi”, semakin besar kerusakan Jika jatuh ke tangan yg keliru. Danau data ini bisa menyebabkan kebocoran data yg tidak menguntungkan.
Meskipun terdapat nilai tambah yg jelas dalam menyatukan data buat tujuan analitis, risiko kebocoran data yang mungkin masih harus dievaluasi dan diperhitungkan dengan kentara. saat data terdesentralisasi, secara komparatif terdapat ukuran tersirat keamanan data. Ini jua mempersulit peretas atau orang dalam yang jahat untuk segera keluar menggunakan semua permata mahkota. sang sebab itu, perusahaan wajib menyadari bahwa begitu data berada di data lake, mereka secara bersamaan mendapatkan kehilangan kendali.
Mengutamakan perlindungan data dan keamanan jaringan
Argumen serupa sudah serta sedang diangkat pada diskusi seputar cloud dan solusi cadangan. Produk lain yg memiliki efek signifikan pada rangkaian solusi proteksi data, sentralisasi data serta kontrol akses juga memainkan peran penting pada konteks ini. Bagi perusahaan, ini artinya tantangan yg kentara serta danau data atau sentralisasi data akibatnya memiliki arti yang ambivalen.
Di akhirnya, perusahaan wajib memikirkan menggunakan hati-hati tentang bagaimana data lake disediakan serta dipergunakan. Apa yang mengalir masuk mampu mengalir keluar. oleh sebab itu, saat memutuskan taktik penyimpanan serta pembongkaran data, potensi akibat kebocoran data wajib dipertimbangkan sejak awal. Sering ada cara netral buat mendesentralisasikan data. Tentu saja, langkah-langkah keamanan jaringan yg tepat juga harus diikuti pada sini. Selain itu, banyak teknik analitik bisa memanfaatkan barah database yg terdapat. Ini memungkinkan data asal banyak asal terdesentralisasi buat dianalisis. Solusi ini tidak mengharuskan semua data ditarik ke data lake. Data terdesentralisasi bisa dikelola melalui prosedur kontrol akses orisinil. Tentu saja, meski dengan pengaturan ini, kebocoran data tidak sepenuhnya dapat dihindari, tetapi jangkauannya permanen jauh lebih mungil.
Sumber : https://morethandigital.info/
