Python ile Veri Bilimi NumPy, Pandas ve Matplotlib Kullanımı
Veri bilimi dünyasında Python'un gücünü keşfedin. NumPy ile hesaplama, Pandas ile veri analizi ve Matplotlib ile görselleştirme konularını örneklerle öğrenin.
Python ile Veri Bilimi: NumPy, Pandas ve Matplotlib Kullanımı
Veri bilimi, günümüzde en hızlı büyüyen teknoloji alanlarından biridir. Büyük veri kümelerini analiz etmek, anlamlı bilgilere dönüştürmek ve görselleştirmek için güçlü araçlara ihtiyaç vardır. Python, veri bilimi dünyasında en çok tercih edilen dillerin başında gelir. Bu başarısının ardında ise NumPy, Pandas ve Matplotlib gibi güçlü kütüphaneler yer alır. Bu rehberde, bu üç temel kütüphaneyi kullanarak veri bilimi süreçlerinin temellerini öğreneceksiniz.
1. NumPy ile Sayısal Hesaplama
NumPy (Numerical Python), yüksek performanslı çok boyutlu dizi nesnesi olan ndarray yapısını sağlar. Ayrıca lineer cebir, Fourier dönüşümleri gibi bilimsel işlemler için çeşitli fonksiyonlar sunar.
Kurulum:
pip install numpy
Kullanımı:
import numpy as np
a = np.array([1, 2, 3])
print("Dizi:", a)
print("Toplam:", np.sum(a))
print("Ortalama:", np.mean(a))
Çok Boyutlu Diziler:
b = np.array([[1, 2], [3, 4]])
print("2D Dizi:\n", b)
print("Transpozu:\n", b.T)
2. Pandas ile Veri Analizi
Pandas, veri yapıları ve veri analizi araçları sunar. Özellikle DataFrame yapısı, tablolara benzer veri yapısını kolayca yönetmeyi sağlar.
Kurulum:
pip install pandas
CSV Dosyası Okuma:
import pandas as pd
df = pd.read_csv("veriler.csv")
print(df.head())
Temel İşlemler:
print("Sütunlar:", df.columns)
print("Satır Sayısı:", len(df))
print("İstatistikler:\n", df.describe())
Filtreleme ve Sıralama:
yeni_df = df[df["yas"] > 25]
sirali = df.sort_values("puan", ascending=False)
Yeni Sütun Ekleme:
df["net_puan"] = df["puan"] - df["ceza"]
3. Matplotlib ile Veri Görselleştirme
Matplotlib, verileri çizgi grafikleri, sütun grafikleri, histogramlar ve daha fazlasıyla görselleştirmenize olanak tanır.
Kurulum:
pip install matplotlib
Temel Grafik:
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [2, 4, 1, 3, 7]
plt.plot(x, y)
plt.title("Basit Çizgi Grafiği")
plt.xlabel("X Ekseni")
plt.ylabel("Y Ekseni")
plt.grid(True)
plt.show()
Çubuk Grafik:
plt.bar(["A", "B", "C"], [10, 20, 15])
plt.title("Sütun Grafiği")
plt.show()
Histogram ve Pasta Grafiği:
plt.hist(df["puan"])
plt.title("Puan Dağılımı")
plt.show()
plt.pie([40, 30, 30], labels=["Python", "Java", "C++"])
plt.title("Dillerin Kullanım Oranı")
plt.show()
Bu Üç Kütüphane ile Neler Yapabilirsiniz?
- Veri temizleme ve ön işleme
- İstatistiksel analizler
- Veri madenciliği uygulamaları
- Makine öğrenmesi için veri hazırlığı
- İnteraktif raporlama ve görselleştirme
Python ile veri bilimi projelerinde başarılı olmak istiyorsanız, NumPy, Pandas ve Matplotlib üçlüsünü iyi öğrenmelisiniz. Bu kütüphaneler sayesinde büyük veri kümeleriyle verimli bir şekilde çalışabilir, analizlerinizi görselleştirerek anlamlı hale getirebilirsiniz. Veri bilimi yolculuğunuzda bu araçlar en sağlam yardımcınız olacaktır.