Her şey dijital çağın başından beri ürettiğimiz veri miktarının patlamasıyla başlıyor. Bu, büyük ölçüde teknolojik gelişmeden ve yaşadığımız dünyadan verileri yakalayabilen internetten kaynaklanıyor.
Verinin kendisi yeni bir buluş değil. Bilgisayarlar, özellikle elektronik tablolar ve veritabanları, verileri kolayca erişilebilir bir şekilde bir ölçekte depolamamıza ve düzenlememize olanak sağladı. Aniden bilgi tek bir tıklama ile elde edildi.
Büyük Veri, genellikle verileri terabayt veya petabayt boyutunun yüzlerce katı tanımlayan bir kavramdır.
Diğer bir tanım ise Beyer ve Laney tarafından desteklendi ve Büyük Veri‘nin boyutlarına odaklandı. Bu tanıma göre, büyük veri “bilgi ve karar vermeyi artırmak ve karlılık gerektiren yenilikçi veri işleme biçimleri olan büyük hacimli, yüksek hızlı ve çeşitli bilgi varlıkları” dır.
Dumbill, daha geniş ve daha kavramsal bir yaklaşımı savundu ve şu açıklamayı yaparak kavramı tanımlamaya çalıştı: “Büyük veri, geleneksel veritabanı sistemlerinin işleme kapasitesinin ötesine geçen verilerdir. Bu veriler çok büyük, çok hızlı hareket ediyor veya veritabanı altyapı alanı için uygun değil. Bu verileri çıkarmak ve işlemek için alternatif bir yol bulunmalı.”
Big Data 5V Tanımı
Hacim(Volume): Verinin boyutu, verilerdeki değerin belirlenmesinde çok önemli bir rol oynar. Ayrıca, belirli verilerin Büyük Veri olarak kabul edilip edilemeyeceği, veri hacmine bağlıdır.
Hız (Velocity): Verilerin üretildiği hızı ifade eder. Gereksinimleri karşılamak için verilerin ne kadar hızlı üretildiği ve işlendiği, verilerin gerçek potansiyelini belirler.
Çeşitlilik (Variety): Yapılandırılmış veri setleri, geleneksel veritabanlarındaki sayısal verilerden yapılandırılmamış metin belgelerine, e-posta, video, ses, borsa verileri ve finansal işlemlere kadar her tür formatta gelir. Çeşitlilik, heterojen kaynakları ve hem yapılandırılmış hem de yapılandırılmamış verilerin doğasını ifade eder.
Doğruluk (Veracity): Veriler, güvenilir ve doğru bilgiler içermelidir. Sağlıklı bir sonuç elde etmek için verilerdeki yanlış ve anlamsız kayıtlar temizlenmelidir. Hatalı veriler zaten anlamlı bilgilere dönüştürülemez.
Değer (Value): Toplanan ve yararlı bilgiler elde edemeyen bir veritabanı işe yaramaz. Bu nedenle mevcut veriler, veri çıkarma yöntemleriyle işlenmeli ve önemli sonuçlar üretilebilmektedir.
Dikkatinizi Çekebilecek Yazılar: Geleceğe Bakış: Büyük Veri
Big Data Nasıl Kullanılır?
Sensörler, fotoğraflar, metin, ses ve video verileri hakkındaki bu artan bilgi akışı, verileri artık birkaç yıl önce mümkün olmayan şekillerde kullanabileceğimizi gösteriyor. Bu, hemen hemen her sektörde iş dünyasında devrim yaratıyor. Şirketler artık hangi müşteri segmentlerini ne zaman satın almak isteyeceklerini tam olarak tahmin edebiliyor. Ayrıca Büyük Veri, şirketlerin operasyonlarını daha verimli yürütmelerine yardımcı olur.
Büyük Veri projeleri, dünyamızı çeşitli şekillerde değiştirmemize yardımcı olur:
- Sağlık hizmetlerini iyileştirme: Veriye dayalı tıp, hastalığı erken tespit etmeye ve yeni ilaçlar geliştirmeye yardımcı olabilecek modeller için birden fazla tıbbi kaydın ve görüntülemenin analiz edilmesini içerir.
- Büyük Veri Teknolojisi: Aynı zamanda dünyanın dört bir yanındaki savaş bölgelerinden gelen mültecilerin akışını izlemek ve korumak için de kullanılır.
- Suç önleme: Polis güçleri, kaynakları daha verimli bir şekilde dağıtmak ve gerektiğinde caydırıcı olmak için kendi bilgilerine ve halka açık veri setlerine dayanan veriye dayalı stratejileri giderek daha fazla benimsiyor.
Büyük Veri bize benzeri görülmemiş perspektifler ve fırsatlar sunar, ancak aynı zamanda ele alınması gereken endişeleri ve soruları da ortaya çıkarır:
- Veri gizliliği: Kişisel yaşamlarımız hakkında, çoğunu gizli tutma hakkına sahip olduğumuz birçok bilgi içerir. İfşa ettiğimiz kişisel veri miktarı ile Big Data uygulamalarının ve hizmetlerinin rahatlığı arasında bir denge bulmamız gerekiyor.
- Veri güvenliği: Birisinin verilerimizi belirli bir amaç için sakladığından memnun olduğumuza karar versek bile, verileri güvende tutacaklarına güvenebilir miyiz?
- Veri ayrımcılığı: Her şey bilindiğinde, insanlar yaşam verilerine dayalı olarak ayrımcılığa uğrayacaklar mı? Kredi puanını kimin ödünç alabileceğine karar vermek için zaten kullanıyoruz ve sigorta büyük ölçüde veri odaklı.
Bu zorlukların üstesinden gelmek önemli bir bölümdür ve verilerden yararlanmak isteyen kuruluşlar tarafından ele alınmalıdır. Bunu yapmamak, şirketleri sadece itibarlarına karşı değil, aynı zamanda yasal ve finansal açıdan da savunmasız hale getirebilir.
Pazarlamada Big Data Kullanma
Büyük Veri kavramı yeni görünse de, kavram aslında birçok şirket için eskidir. Şirketler kavramı çeşitli yönlerden kullanmaya başladıktan sonra, konseptin kendisi ifade edildi. Big Data, neredeyse her pazarlama hikayesinin kahramanı haline geldi. Pazarlamada Büyük Veriyi kullanma örnekleri şunları içerir:
eBay: Kullanıcılar eBay’de “takip ettikleri” kategorileri seçtikten sonra, “besleme” ekranından bu kategorilerdeki yeni ürünleri takip edebilirler. Bunun pazarlama açısından önemi, eBay pazarlama biriminin kullanıcıların en çok takip ettiği kategorileri kolaylıkla takip edebilmesi ve müşterilerin halihazırda ilgilendikleri ürünleri çok daha kolay kullanabilmesidir.
Netflix: Netflix, Amerika’da internet televizyonu izleme imkanı sunan firmalardan biridir. Onları diğer şirketlerden açıkça ayıran “Öneri” algoritmaları, daha iyi bir gerçek zamanlı deneyim için müşteri eylemlerine dönüşür.
Büyük Veri Şaşırtıcı Gerçekler
- Dünyadaki tüm verilerin %90’ından fazlası son 2 yılda oluşturulmuştur.
- Sektör tarafından toplanan ve depolanan toplam veri miktarı her yıl iki katına çıkmaktadır.
- Her dakika 204 milyon e-posta gönderiyor, Facebook’ta 1,8 milyon beğeni topluyor, 278 bin Tweet gönderiyor ve Facebook’a 200 bin fotoğraf yüklüyoruz.
- Her dakika yaklaşık 100 saatlik video yükleniyor.
Sonuç Olarak Big Data
Arama motorları büyük veriyle ilk karşılaşanlar oldu. Milyarlarca sayfa arasından kullanıcıların istediği sayfaları makul bir sürede bulmaya çalıştılar. Ancak günümüzde akademi dünyasından sağlık sektörüne, büyük ölçekli e-ticaret uygulamalarından eğitim sektörüne kadar her alanda buluşmak mümkün. İncelenen Büyük Verinin özellikleri ve sorunları nedeniyle bu ölçekte verilerin geleneksel yöntemlerle işlenmesi verimli değildir. Bu sorun, BT endüstrisini ve araştırmacıları verimli işlemeleri için araçlar, yöntemler ve algoritmalar bulmaya yönlendirdi.