PENGERTIAN
Python Data Analysis Library yang disingkat
Pandas adalah sebuah library pada Python yang bersifat open source dengan
lisensi BSD yang menyediakan struktur data dan analisis data yang mudah digunakan.
pandas biasa digunakan untuk membuat tabel, menganalisis data, manipulasi data,
mengubah dimensi data, mengecek data dan lain sebagainya. Struktur data dasar
pada Pandas dinamakan DataFrame, yang memudahkan kita untuk membaca
sebuah file dengan banyak jenis format seperti file .txt, .csv, dan .tsv.
Pandas DataFrame adalah struktur data 2 Dimensi. Data distrukturisasi seperti
tabel yang berisi baris merepresentasikan record dan kolom merepresentasikan
field, sehingga mudah untuk melakukan queri atau mengakses data tersebut.
MENGINSTALL PANDAS
Pada modul standar disaat pertama kali
instalasi Python, secara default Pandas tidak tersedia sehingga sebelum
menggunakan kita diharuskan untuk melakukan instalasi terlebih dahulu. Kita
bisa menjalankan perintah dengan menggunakan pip ataupun anaconda untuk
menginstall pandas.
Dengan menggunakan pip:
Setelah berhasil instalasi Pandas, maka kita dapat menggunakannya untuk melakukan manipulasi data dengan cara import modul tersebut pada projek yang akan kita buat.
MENCOBA SERIES
Pandas Series adalah struktur data dasar
Pandas yang berbentuk array berlabel satu dimensi sama halnya dengan numpy
array, hanya bedanya mempunyai index dan index tersebut dapat kita kontrol dari
setiap elemen tersebut. Perintah dasar untuk membuat sebuah series dengan
Pandas adalah :
Parameter
data, diisi dengan data yang akan dibuat series. Struktur data yang bisa
ditampung berupa integer, float, dan juga string. parameter index, diisi dengan
index dari series. Jumlah index harus sama dengan jumlah data. Jika kita tidak
mengisi parameter index, maka series akan memiliki index integer seperti halnya
array biasa. Parameter dtype, diisi dengan tipe data dari series, dan parameter
copy untuk copy data, secara default akan bernilai false.
Berdasarkan sintaks di atas, kita akan membuat contoh series menggunakan Python list ataupun numpy sebagai contoh data untuk membuat series.
Dijalankan hasilnya adalah :
Dijalankan
hasilnya adalah :
MENCOBA DATA FRAME
Data frame merupakan tabel/data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada data frame merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.
Keterangan:
§ index : label untuk baris
§ columns : label untuk kolom
§ dtype : tipe data per kolom
§ copy : digunakan untuk menyalin data, defaultnya False
Tidak ada komentar:
Posting Komentar