Senin, 26 Desember 2022

Mengenal Pandas Library pada Python

PENGERTIAN

Python Data Analysis Library yang disingkat Pandas adalah sebuah library pada Python yang bersifat open source dengan lisensi BSD yang menyediakan struktur data dan analisis data yang mudah digunakan. pandas biasa digunakan untuk membuat tabel, menganalisis data, manipulasi data, mengubah dimensi data, mengecek data dan lain sebagainya. Struktur data dasar pada Pandas dinamakan DataFrame, yang memudahkan kita untuk membaca sebuah file dengan banyak jenis format seperti file .txt, .csv, dan .tsv. Pandas DataFrame adalah struktur data 2 Dimensi. Data distrukturisasi seperti tabel yang berisi baris merepresentasikan record dan kolom merepresentasikan field, sehingga mudah untuk melakukan queri atau mengakses data tersebut.

 

MENGINSTALL PANDAS

Pada modul standar disaat pertama kali instalasi Python, secara default Pandas tidak tersedia sehingga sebelum menggunakan kita diharuskan untuk melakukan instalasi terlebih dahulu. Kita bisa menjalankan perintah dengan menggunakan pip ataupun anaconda untuk menginstall pandas.


Dengan menggunakan pip:

Dengan menggunakan Anaconda :

Setelah berhasil instalasi Pandas, maka kita dapat menggunakannya untuk melakukan manipulasi data dengan cara import modul tersebut pada projek yang akan kita buat.


MENCOBA SERIES

Pandas Series adalah struktur data dasar Pandas yang berbentuk array berlabel satu dimensi sama halnya dengan numpy array, hanya bedanya mempunyai index dan index tersebut dapat kita kontrol dari setiap elemen tersebut. Perintah dasar untuk membuat sebuah series dengan Pandas adalah :

Parameter  data, diisi dengan data yang akan dibuat series. Struktur data yang bisa ditampung berupa integer, float, dan juga string. parameter index, diisi dengan index dari series. Jumlah index harus sama dengan jumlah data. Jika kita tidak mengisi parameter index, maka series akan memiliki index integer seperti halnya array biasa. Parameter dtype, diisi dengan tipe data dari series, dan parameter copy untuk copy data, secara default akan bernilai false.

Berdasarkan sintaks di atas, kita akan membuat contoh series menggunakan Python list ataupun numpy sebagai contoh data untuk membuat series.

Dijalankan hasilnya adalah :


Untuk mengatur indeks dari series, kita bisa menggunakan parameter index. Contohnya disini kita akan melakukan pengaturan indeks pada data numpy array yang sudah kita buat sebelumnya dengan indeks [1,2,3,4,5].


Dijalankan hasilnya adalah :

Dapat dilihat bahwa indeks dari series berubah menjadi [1,2,3,4,5]. Perlu diperhatikan agar panjang dari data harus disesuaikan dengan pengaturan indeks, sehingga tidak menimbulkan error.

MENCOBA DATA FRAME

Data frame merupakan tabel/data tabular dengan array dua dimensi yaitu baris dan kolom. Struktur data ini merupakan cara paling standar untuk menyimpan data. Setiap kolom pada data frame merupakan objek dari Series, dan baris terdiri dari elemen yang ada pada Series.

Untuk membuat data frame, digunakan sintaks berikut :

Keterangan:

§  index               : label untuk baris

§  columns          : label untuk kolom

§  dtype               : tipe data per kolom

§  copy                 : digunakan untuk menyalin data, defaultnya False


Berikut contoh untuk menunjukkan pembuatan Data Frame :











 

 


 

 

 

 



Tidak ada komentar:

Posting Komentar

Mengenal Pandas Library pada Python

PENGERTIAN Python Data Analysis Library yang disingkat Pandas adalah sebuah library pada Python yang bersifat open source dengan lisensi ...