Seperti penjelasan sekenanya di artikel Big Data: Big Bingung, teknologi big data adalah suatu teknologi yang memungkinkan pengolahan catatan digital yang terus menerus tercipta setiap saat dengan velocity tinggi dan volume besar, baik lokal maupun global, menjadi informasi yang bernilai tinggi. Sumber data digital tersebut bermacam-macam. Variasi dan formatnya juga bermacam-macam. Data scientist menggunakan big data analytics untuk menemukan (men-discovery) informasi yang bernilai tinggi tersebut, yang kemudian dapat digunakan dalam proses produksi.
Biasanya artikel mengenai big data menyebut internet dan jejaring sosial semacam Facebook dan Twitter sebagai sumber big data. Ya, contoh itu memang paling mudah. Yang agak sulit dimengerti, meskipun sudah berjalan di perusahaan-perusahaan besar, adalah big data berupa streaming yang bersumber dari sensor-sensor yang mengukur dan kemudian mengirim ukurannya ke tempat pengolahan. Misalnya sensor yang terpasang di turbin-turbin produksi General Electric (GE) yang jumlah turbinnya saja di seluruh dunia luar biasa banyak. Apalagi jumlah sensor dan data yang diproduksi secara keseluruhan. Mungkin kita bertanya-tanya apa untungnya buat GE mengumpulkan semua data yang segunung itu?
Ayo, kita hela nafas dikit... Ga apa. Wajar aja kalau big bingung dengan big data. Bayangkan jika data dari sensor turbin-turbin GE yang terpasang di seluruh dunia itu bisa diolah oleh para data scientist GE untuk mengetahui keadaan dari setiap turbin. Setiap saat! Lebay ya? Apakah turbinnya, misalnya di padang pasir Timur Tengah, masih berjalan normal. Apakah kinerja mulai menurun? Apakah ada fungsi yang tiba-tiba tidak berjalan. Dengan pengetahuan itu saja, GE mampu menyediakan layanan yang sangat cepat tanggap ke pengguna turbinnya. Lebih jauh lagi, GE bisa lebih efisien mengelola service termasuk site visit ke padang pasir dengan lebih murah. GE untung. Customer-nya juga untung. Keuntungan dari big data!
Contoh yang lebih sehari-hari misalnya dalam manajemen lalu lintas. Barangkali Bu Airin tiba-tiba terinspirasi menerapkannya di Tangsel. Memang kasus ini agak ngarang sih, tapi who knows? Umpamanya Pemkot Tangsel bisa memasang sensor di seluruh jalanan, untuk permulaannya misalnya di tiap perempatan atau lampu lalu lintas. Sensor itu berfungsi mengukur kondisi lalu lintas. Berapa kecepatan kendaraan? Berapa kendaraan yang lewat? Misalnya saja itu bisa dilakukan. Kemudian setiap sensor mengirim data pengukurannya ke kantor pengelola lalu lintas. Dengan data scientist yang cakap yang kemudian bisa membuat algoritma ciamik untuk pemantauan, kondisi lalu lintas tiap jalanan di Tangsel bisa diketahui setiap saat.
Sebenarnya Bu Airin punya alternatif lain. Bisa saja Bu Airin menyewa satelit khusus memotret dan mengirim gambar Tangsel setiap berapa waktu. Perangkat lunak analytics yang mampu mengolah gambar memang masih harus dibeli, tapi kalau mampu, lagi-lagi Pemerintahan Bu Airin bisa mengetahui kondisi jalanan setiap saat. Dengan pengetahuan itu, manajemen lalu lintas bisa lebih baik. Misalnya, lebih cepat memutuskan kapan harus mengirim petugas. Ke lokasi mana saja. Kantor manajemen lalu lintas kemudian bisa memberikan penerangan ke pengguna jalan agar menghindari area tertentu atau merekomendasikan jalur alternatif, bekerja sama dengan stasiun radio atau lewat akses langsung para pengguna mobile app Pemkot Tangsel. Lebih canggih lagi seandainya dari data satelit atau sensor di atas, yang pasti volumenya luar biasa, Bu Airin dan staf bisa mengembangkan automated traffic control system.
Mahal? Mau murah? Mungkin bisa bekerjasama dengan GoogleMap atau Waze. Basisnya pengumpulan data dari jejaring sosial. Jadi 'sensor' dalam hal ini adalah para pengendara itu sendiri yang mengirim sinyal lokasi dan kecepatannya masing-masing. Saya mendengar dari seorang kawan. Katanya dia pernah membaca berita bahwa Jakarta bermaksud bekerjasama dengan Waze dalam kaitan dengan manajemen lalu lintas ini.
Lalu apa lagi manfaat big data? Kan sayang kalau sudah menyimpan big data yang amat bejibun, tetapi tidak banyak manfaatnya? Mau untung malah buntung. Kita-kita ini pengguna teknologi sudah semestinya berhati-hati. Tidak boleh percaya begitu saja pada vendor. Vendor biasanya mengatakan yang bagus-bagus saja. Malah vendor cukup sering mengiyakan pemanfaatan suatu teknologi yang sebetulnya kurang tepat. Bahasa kerennya: business use case tidak cocok. Pengamat yang berada di pinggiran malah jadi sinis. Wah... si fulan menginisiasi proyek terkait big data atau teknologi apa saja hanya untuk manjang-manjangin pengalaman kerja (credential). Ada apa pula dia dengan vendor itu?
Runyam kan kalau kondisinya jadi penuh curiga gitu? Begini... Saya mau share dikit. Saya diminta baca buku big data @ work karangan Thomas Davenport. Bagus bukunya. Beliau memang bukan orang yang tahu detil mengenai IT. Beliau mungkin lebih tepat kalau disebut sebagai penulis strategi. Di bukunya, beliau membuat tiga kategori business case pemanfaatan big data.
Yang pertama adalah cost/time reduction. Yang kedua adalah new products and services. Yang ketiga adalah internal business decision support. Untuk yang ketiga ini perlu sedikit hati-hati. Thomas Davenport mengatakan:
"Traditional information manajement and analytics were primarily about supporting internal decisions. Big data is somewhat different in this regard..."
"... instead of creating reports or presentations that advise senior executive on internal decisions, data scientists commonly work on customer-facing products and services."
Namun demikian, menurut Davenport, bukannya tidak ada kasus yang bagus untuk pemanfaatan big data dalam mendukung keputusan. Ada ga contoh-contohnya? Ah, tunggu ya, masih ada dua bab yang belum selesai saya baca. In syaa Allah, saya lanjutin di artikel berikutnya. Kalau untuk mendukung riset, ada ga? Mestinya ada. Saya pernah baca, ada peneliti yang menggunakan Google Trend untuk mengikuti 'keyword' tertentu kemudian membandingkannya dengan indikator yang biasa diperoleh secara konvensional.