Video: Veri Analisti | Kemal Öztürk | İstatistik - Fen Edebiyat Fakültesi 2024
Herkes kariyerinin yüksek talep olmasını istiyor - çünkü talep büyük bir maaşa ve hiç iş arzusuna yol açmıyor. Her geçen gün büyük veri alanı, bu tür bir istihdam ile doludur, çünkü her ölçekteki şirket, kararlar ve tahminler yapmak (ve sonuçlar almak) için bilgi toplamak ve analiz etmek durumunda kalmaktadır.
Tam da veri bilimcilerinin yaptığı şey budur: bilgi keşfetmek, bağlantı kurmak, veri görselleştirmeleri oluşturmak ve şirketlerin verimli çalışmasına yardımcı olmak.
Ve istatistiklerin yorumlanması ve veritabanlarıyla çalışılması için doğru programlama dillerinin kapsamlı bir şekilde anlaşılması şarttır.
KDnuggets'a göre, veri bilimcilerinin% 91'i aşağıdaki dört dili kullanıyor.
Dil 1: R
R, veri madencileri arasında popüler olan istatistik odaklı bir dildir. S'nin açık kaynak kodlu, nesne yönelimli bir uygulamasıdır ve öğrenmek aşırı derecede zor değildir.
İstatistiksel yazılımı nasıl geliştireceğinizi öğrenmek istiyorsanız, R bilmek iyi bir dildir. Ayrıca, verileri manipüle etmenizi ve grafiksel olarak görüntülemenizi sağlar.
Veri Bilim Uzmanlığı programının bir parçası olarak, Coursera size sadece bir dilde nasıl program yapacağınızı öğretmekle kalmayıp aynı zamanda veri bilimi / analizi bağlamında nasıl uygulayacağınızı anlatan bir sınıf sunmaktadır.
Dil 2: SAS
R gibi, SAS öncelikle istatistiksel analiz için kullanılır. Verileri veritabanlarından ve elektronik tablolarından okunabilir biçime (HTML ve PDF belgeleri gibi) dönüştürmenin yanı sıra daha görsel tablolar ve grafikler oluşturmaya yönelik güçlü bir araçtır.
Başlangıçta akademik araştırmacılar tarafından geliştirilmiş olup, şirketler ve kuruluşlar için dünyanın her yerindeki en popüler analiz araçlarından biri haline gelmiştir. Daha büyük bir kurumsal yazılım türüdür ve genellikle küçük şirketler veya kendi başlarına çalışan kişiler tarafından kullanılmaz.
SAS'ı öğrenmek için kaynaklar bu belgede listelenmiştir.
Dil açık kaynak değildir, bu yüzden büyük olasılıkla kendinize ücretsiz öğreteceksiniz.
Dil 3: Python
R ve SAS, analitik dünyada "büyük iki" olarak düşünülse de, yakın zamanda bir yarışmacı haline geldi. Ana avantajlarından biri, çok çeşitli kütüphaneler (örn., Pandas, NumPy, SciPi, vb.) Ve istatistiksel işlevlerdir.
Python (R gibi) bir açık kaynak dili olduğundan güncellemeler hızlı bir şekilde eklenir. (SAS gibi satın alınan programlarla bir sonraki sürümü beklemelisiniz.)
Dikkat çekilmesi gereken diğer bir faktör, sadeliği ve üzerinde kurslar ve kaynaklar bulunması nedeniyle Python'un öğrenilmesi en kolay belki olmasıdır. Bu web sitesi başlamak için harika bir yer.
Python öğrenim materyallerinin daha dolu bir listesini de burada bulabilirsiniz.
Dil 4: SQL
Şimdiye dek aynı ailede ve aynı işlevlere sahip olan dillere bakıyoruz. "Yapılandırılmış Sorgu Dili" anlamına gelen SQL, burada değişiklik yapar. Bu dil istatistikle ilgisi yoktur; İlişkisel veritabanlarındaki bilgileri işleme üzerine yoğunlaşmaktadır.
Bu, en çok kullanılan veritabanı dili ve açık kaynaktır, bu yüzden hevesli veri bilimcileri kesinlikle onu atlamamalıdır.
Öğrenme SQL, SQL veritabanları oluşturmak, içindeki verileri yönetmek ve ilgili işlevleri kullanmak için sizi donatmalıdır. Udemy, tüm temel bilgileri kapsayan ve oldukça hızlı ve acısız bir şekilde tamamlanabilen bir eğitim kursu sunmaktadır.
Sonuç
En azından muhtemelen SQL öğrenip istatistik dillerinden en az birini seçmelisiniz. Ancak zamanınız varsa (ve SAS'ın durumunda, para) ve pazarlanabilirliğinize gerçekten çok fazla ulaşmak istiyorsanız, dörtünü de öğrenemeyeceğinizi söyleyecek hiçbir şeyiniz yok!
Acele etmeyin, çok fazla antrenman yapın, becerilerinizi geliştirin ve iş güvencesinin tadını çıkarın.
Busuu: Bedava Yeni Diller Öğrenin
Diğer yabancı dil konuşmacıları ve etkileşimli derslerle dil öğrenmek için busuu ziyaret edin. Hareket halindeyken kendinize öğretmek için ücretsiz bir mobil uygulama da bulunmaktadır.