Şirketler giderek daha fazla veriye dayalı olarak pazar ve çevre verilerini algılıyor ve karmaşık kalıpları tanımak, değişiklikleri tespit etmek ve sonuçları doğrudan etkileyen tahminler yapmak için analitik ve makine öğrenimini kullanıyor. Veri odaklı şirketler, veri yığınlarını yönetmek ve anlamlandırmak için veri bilimini kullanıyor.
Veri bilimi her sektörün bir parçasıdır. Perakende, finans, sağlık ve lojistik alanlarında faaliyet gösteren büyük şirketler, rekabet güçlerini, yanıt verme yeteneklerini ve verimliliklerini artırmak için veri bilimi teknolojilerinden yararlanıyor. Reklam şirketleri bunu reklamları daha etkili bir şekilde hedeflemek için kullanır. İpotek şirketleri bunu maksimum getiri için temerrüt riskini doğru bir şekilde tahmin etmek için kullanır. Perakendeciler de bunu tedarik zincirlerini kolaylaştırmak için kullanıyor. Aslında bu büyük veri devrimini ateşleyen şey, 2000'li yılların ortalarında Hadoop, NumPy, scikilearn, Pandas ve Spark gibi açık kaynaklı, büyük ölçekli veri analitiği ve makine öğrenimi yazılımlarının mevcut olmasıydı.
Bugün veri bilimi ve makine öğrenimi dünyanın en büyük bilgi işlem segmenti haline geldi. Tahmine dayalı makine öğrenimi modellerinin doğruluğundaki mütevazı iyileştirmeler, sonuçta milyarlarca dolara dönüşebilir. Tahmine dayalı modellerin eğitimi veri biliminin temelini oluşturur. Aslında veri bilimine yönelik BT bütçelerinin büyük bir kısmı, veri dönüşümü, özellik mühendisliği, eğitim, değerlendirme ve görselleştirmeyi içeren makine öğrenimi modelleri oluşturmaya harcanıyor. En iyi modelleri oluşturmak için veri bilimcilerinin çok sayıda yinelemeyle eğitmesi, değerlendirmesi ve yeniden eğitmesi gerekir. Bugün bu yinelemeler günler alıyor, üretime geçmeden önce kaç tane yinelemenin gerçekleşebileceğini sınırlıyor ve nihai sonucun kalitesini etkiliyor.
Analitik ve makine öğrenimini kuruluşlar genelinde yürütmek için devasa bir altyapı gerekir. Fortune 500 şirketleri, devasa veri bilimi kümeleri oluşturmak için bilişimin ölçeğini genişletiyor ve binlerce CPU sunucusuna yatırım yapıyor. CPU ölçeğini genişletme artık etkili değil. Dünyadaki veriler her yıl iki katına çıkarken, CPU hesaplaması Moore yasasının sona ermesiyle birlikte duvara çarptı. GPU'lar, aynı anda birden fazla görevi yerine getirmek üzere tasarlanmış binlerce küçük verimli çekirdekten oluşan büyük ölçüde paralel bir mimariye sahiptir. Bilimsel bilgi işlem ve derin öğrenmenin NVIDIA GPU hızlandırmasına dönüşmesine benzer şekilde, veri analitiği ve makine öğrenimi de GPU paralelleştirme ve hızlandırmasından yararlanacak.