Veri bilimi ve analizine adım atarken, Python ekosisteminin en güçlü kütüphanelerinden biri olan Pandas vazgeçilmez bir araçtır. Bu kısa rehberde, Python'da pd.DataFrame fonksiyonunu kullanarak sıfırdan nasıl bir veri seti oluşturabileceğinizi ve bu veri setine nasıl yeni sütunlar ekleyebileceğinizi inceleyeceğiz.
1. Kütüphanelerin Projeye Dahil Edilmesi
İlk adım olarak, veri manipülasyonu için kullanacağımız NumPy ve Pandas kütüphanelerini projemize içe aktarmalıyız.
import numpy as np import pandas as pd
2. Pandas DataFrame Oluşturma
6 satır ve 3 sütundan oluşan bir veri seti tasarlayalım. Kolonlarımız; genişlik, yükseklik ve hacim olsun. pd.DataFrame fonksiyonu temelde iki parametreye ihtiyaç duyar: Verilerin kendisi ve sütun isimleri.
# Verilerin NumPy dizisi olarak tanımlanması veri = np.array([[2, 3, 4], [10, 7, 8], [20, 9, 11], [30, 14, 28], [40, 15, 32], [15, 91, 84]]) # Sütun isimlerinin belirlenmesi sutun_isimleri = ['genislik', 'yukseklik', 'hacim'] # DataFrame oluşturma ve ekrana yazdırma veriseti = pd.DataFrame(data=veri, columns=sutun_isimleri) print(veriseti)
3. Veri Setine Yeni Sütun Ekleme
Oluşturduğumuz veri setine sonradan yeni bir sütun (örneğin: ağırlık) eklemek oldukça pratiktir.
# 'agirlik' adında yeni bir sütun ekliyoruz veriseti["agirlik"] = np.array([4, 5, 6, 7, 8, 9]) print(veriseti)
Bu rehberde genel hatlarıyla Python DataFrame oluşturma ve temel veri seti işlemlerine değindik. Takıldığınız yerleri yorumlar kısmında belirtebilirsiniz.
Yorumlar
Yorum Gönder