Python ile Veri Bilimi NumPy, Pandas ve Matplotlib Kullanımı

Veri bilimi dünyasında Python'un gücünü keşfedin. NumPy ile hesaplama, Pandas ile veri analizi ve Matplotlib ile görselleştirme konularını örneklerle öğrenin.

Ali YILMAZ
Ali YILMAZ

Yönetici

61

Python ile Veri Bilimi: NumPy, Pandas ve Matplotlib Kullanımı

Veri bilimi, günümüzde en hızlı büyüyen teknoloji alanlarından biridir. Büyük veri kümelerini analiz etmek, anlamlı bilgilere dönüştürmek ve görselleştirmek için güçlü araçlara ihtiyaç vardır. Python, veri bilimi dünyasında en çok tercih edilen dillerin başında gelir. Bu başarısının ardında ise NumPy, Pandas ve Matplotlib gibi güçlü kütüphaneler yer alır. Bu rehberde, bu üç temel kütüphaneyi kullanarak veri bilimi süreçlerinin temellerini öğreneceksiniz.

1. NumPy ile Sayısal Hesaplama

NumPy (Numerical Python), yüksek performanslı çok boyutlu dizi nesnesi olan ndarray yapısını sağlar. Ayrıca lineer cebir, Fourier dönüşümleri gibi bilimsel işlemler için çeşitli fonksiyonlar sunar.

Kurulum:

pip install numpy

Kullanımı:

import numpy as np

a = np.array([1, 2, 3])
print("Dizi:", a)
print("Toplam:", np.sum(a))
print("Ortalama:", np.mean(a))

Çok Boyutlu Diziler:

b = np.array([[1, 2], [3, 4]])
print("2D Dizi:\n", b)
print("Transpozu:\n", b.T)

2. Pandas ile Veri Analizi

Pandas, veri yapıları ve veri analizi araçları sunar. Özellikle DataFrame yapısı, tablolara benzer veri yapısını kolayca yönetmeyi sağlar.

Kurulum:

pip install pandas

CSV Dosyası Okuma:

import pandas as pd

df = pd.read_csv("veriler.csv")
print(df.head())

Temel İşlemler:

print("Sütunlar:", df.columns)
print("Satır Sayısı:", len(df))
print("İstatistikler:\n", df.describe())

Filtreleme ve Sıralama:

yeni_df = df[df["yas"] > 25]
sirali = df.sort_values("puan", ascending=False)

Yeni Sütun Ekleme:

df["net_puan"] = df["puan"] - df["ceza"]

3. Matplotlib ile Veri Görselleştirme

Matplotlib, verileri çizgi grafikleri, sütun grafikleri, histogramlar ve daha fazlasıyla görselleştirmenize olanak tanır.

Kurulum:

pip install matplotlib

Temel Grafik:

import matplotlib.pyplot as plt

x = [1, 2, 3, 4, 5]
y = [2, 4, 1, 3, 7]

plt.plot(x, y)
plt.title("Basit Çizgi Grafiği")
plt.xlabel("X Ekseni")
plt.ylabel("Y Ekseni")
plt.grid(True)
plt.show()

Çubuk Grafik:

plt.bar(["A", "B", "C"], [10, 20, 15])
plt.title("Sütun Grafiği")
plt.show()

Histogram ve Pasta Grafiği:

plt.hist(df["puan"])
plt.title("Puan Dağılımı")
plt.show()

plt.pie([40, 30, 30], labels=["Python", "Java", "C++"])
plt.title("Dillerin Kullanım Oranı")
plt.show()

Bu Üç Kütüphane ile Neler Yapabilirsiniz?

  • Veri temizleme ve ön işleme
  • İstatistiksel analizler
  • Veri madenciliği uygulamaları
  • Makine öğrenmesi için veri hazırlığı
  • İnteraktif raporlama ve görselleştirme

 

Python ile veri bilimi projelerinde başarılı olmak istiyorsanız, NumPy, Pandas ve Matplotlib üçlüsünü iyi öğrenmelisiniz. Bu kütüphaneler sayesinde büyük veri kümeleriyle verimli bir şekilde çalışabilir, analizlerinizi görselleştirerek anlamlı hale getirebilirsiniz. Veri bilimi yolculuğunuzda bu araçlar en sağlam yardımcınız olacaktır.




Paylaş

Etiketler


Yorum Yok

    Bu Yazıya Hiç Yorum Yapılmamış. İlk Yorum Yapan Sen Ol !

Yorum Yap


Instagram