Apa itu Big Data?

Advertisemen
Big Data adalah istilah untuk kumpulan data yang sangat besar atau kompleks sehingga perangkat lunak pengolah data tradisional tidak memadai untuk menghadapinya. Tantangan meliputi penangkapan, penyimpanan, analisis, curation data, pencarian, sharing, transfer, visualisasi, query, update dan informasi privasi . Istilah "Big Data" sering merujuk hanya pada penggunaan analisis prediktif, analisis perilaku pengguna, atau beberapa metode analisis data lanjutan lainnya yang mengekstrak nilai dari data, dan jarang ke ukuran kumpulan data tertentu. "Ada sedikit keraguan bahwa jumlah data yang tersedia saat ini memang besar, tapi itu bukan karakteristik yang paling relevan dari ekosistem data baru ini". Analisis kumpulan data dapat menemukan korelasi baru untuk "melihat tren bisnis, mencegah penyakit, memerangi kejahatan dan sebagainya". Para ilmuwan, eksekutif bisnis, praktisi kedokteran, periklanan dan pemerintah sama-sama mengalami kesulitan dalam kumpulan data yang besar di bidang-bidang termasuk pencarian di internet, fintech, informatika perkotaan, dan informatika bisnis. Ilmuwan menghadapi keterbatasan dalam pekerjaan e-Science, termasuk meteorologi, genomik, connectomics, simulasi fisika kompleks, biologi dan penelitian lingkungan.

Kumpulan data berkembang dengan pesat - sebagian karena mereka semakin terkumpul oleh informasi penginderaan Internet yang murah dan banyak informasi seperti perangkat mobile, penginderaan jarak jauh, software log, kamera, mikrofon, pembaca identifikasi frekuensi radio (RFID) dan Jaringan sensor nirkabel Kapasitas per kapita teknologi dunia untuk menyimpan informasi kira-kira berlipat ganda setiap 40 bulan sejak tahun 1980an; pada 2012, setiap hari 2,5 exabyte (2,5 × 10 18 ) data dihasilkan. Satu pertanyaan untuk perusahaan besar adalah menentukan siapa yang harus memiliki inisiatif data besar yang mempengaruhi keseluruhan organisasi.

Sistem manajemen basis data relasional dan statistik desktop - dan visualisasi - paket sering kali mengalami kesulitan dalam menangani data yang besar. Pekerjaan mungkin memerlukan "perangkat lunak paralel besar yang berjalan pada puluhan, ratusan, atau bahkan ribuan server". Yang penting sebagai "data besar" bervariasi tergantung pada kemampuan pengguna dan alat mereka, dan kemampuan memperluas membuat data besar menjadi sasaran yang bergerak. "Untuk beberapa organisasi, yang menghadapi ratusan gigabyte data untuk pertama kalinya dapat memicu kebutuhan untuk mempertimbangkan kembali pilihan pengelolaan data. Bagi orang lain, mungkin diperlukan puluhan atau ratusan terabyte sebelum ukuran data menjadi pertimbangan yang signifikan."

Istilah ini telah digunakan sejak tahun 1990an, dengan beberapa memberi pujian kepada John Mashey untuk coining atau setidaknya membuatnya populer. Data besar biasanya mencakup kumpulan data dengan ukuran di luar kemampuan alat bantu perangkat lunak yang umum digunakan untuk menangkap, menahan, mengelola, dan memproses data dalam waktu yang dapat dilalui. Filosofi Big Data mencakup data terstruktur, semi terstruktur dan terstruktur, namun fokus utamanya adalah pada data tidak terstruktur. Big data "size" adalah target yang terus bergerak, pada tahun 2012 mulai dari beberapa lusin terabyte hingga banyak petabyte data. Data besar memerlukan seperangkat teknik dan teknologi dengan bentuk integrasi baru untuk mengungkapkan wawasan dari kumpulan data yang beragam, kompleks, dan berskala besar.

Dalam sebuah laporan penelitian tahun 2001 dan kuliah terkait, META Group (sekarang Gartner ) mendefinisikan tantangan dan peluang pertumbuhan data sebagai tiga dimensi, yaitu peningkatan volume (jumlah data), kecepatan (kecepatan data masuk dan keluar), dan Variasi (range tipe dan sumber data). Gartner, dan sekarang banyak industri, terus menggunakan model "3V" untuk menggambarkan data besar. Pada tahun 2012, Gartner memperbarui definisinya sebagai berikut: "Data besar adalah aset dengan volume tinggi, kecepatan tinggi, dan / atau tinggi yang memerlukan bentuk pemrosesan baru untuk memungkinkan pengambilan keputusan, penemuan wawasan dan pengoptimalan proses yang lebih baik." Definisi Gartner tentang 3V masih banyak digunakan, dan sesuai dengan definisi konsensual yang menyatakan bahwa "Data Besar mewakili aset Informasi yang dicirikan oleh Volume, Velocity dan Ragam yang tinggi sehingga memerlukan Teknologi dan Metode Analitik yang spesifik untuk transformasi menjadi Nilai". Selain itu, V "Veracity" baru ditambahkan oleh beberapa organisasi untuk menggambarkannya, revisionisme ditantang oleh beberapa otoritas industri. 3V telah diperluas ke karakteristik komplementer lain dari big data:

Volume: data besar tidak sampel; Itu hanya mengamati dan melacak apa yang terjadi
Kecepatan: data besar sering tersedia secara real-time
Ragam: data besar menarik dari teks, gambar, audio, video; Plus itu melengkapi potongan yang hilang melalui fusi data
Mesin belajar: data besar sering tidak bertanya mengapa dan hanya mendeteksi pola
Jejak digital: data besar seringkali merupakan hasil sampingan bebas biaya dari interaksi digital
Kematangan konsep yang semakin meningkat secara lebih jelas menggambarkan perbedaan antara data besar dan Business Intelligence :

Business Intelligence menggunakan statistik deskriptif dengan data dengan kerapatan informasi tinggi untuk mengukur sesuatu, mendeteksi tren, dan lain-lain.
Data besar menggunakan statistik induktif dan konsep dari identifikasi sistem nonlinier untuk menyimpulkan undang-undang (regresi, hubungan nonlinier, dan efek kausal) dari kumpulan data yang besar dengan kepadatan informasi rendah untuk mengungkapkan hubungan dan ketergantungan, atau untuk melakukan prediksi terhadap Hasil dan perilaku.

Sumber : wikipedia.com
Advertisemen

Disclaimer: Gambar, artikel ataupun video yang ada di web ini terkadang berasal dari berbagai sumber media lain. Hak Cipta sepenuhnya dipegang oleh sumber tersebut. Jika ada masalah terkait hal ini, Anda dapat menghubungi kami disini.
Related Posts
Disqus Comments
© Copyright 2017 Cybertuah.Net - All Rights Reserved - Template Created by goomsite - Proudly powered by Blogger