Pandas Tutorial: Mengenal Pandas – pesonainformatika.com, masih belajar bahasa pemrograman python, kali ini kita akan belajar salah satu library yang banyak digunakan untuk berbagai keperluan salah satunya untuk mengolah data, yap pandas, kita akan mengulas apa itu pandas dan di seri pandas tutorial kita akan belajar pandas dari 0.
Mengenal Pandas
pandas adalah salah satu library yang digunakan untuk mengolah, memanipulasi, mengolah, dan menganalisis data, terdapat beberapa keunggulan dan fitur menarik berikut beberapa fitur pandas
Fitur-fitur Pandas
berikut adalah beberapa fitur dan keunggulan pandas
- object dataframe cepat dan efisien
- terdapat fungsi yang dapat memuat data object data dalam memori dan format file yang berbeda
- Terdapat Fungsi untuk Mengolah dan Setting Data Waktu (Time Series Function)
Menginstall Pandas
Pandas dapat diinstall menggunakan pip, pastikan sudah menginstall python terlebih dahulu, pandas dapat di install menggunakan perintah pip
pip install pandas
cara instalasinya dapat dilihat di pypi.org
Mengenal Pandas Data Structure
pandas mempunyai struktur data dasar yang biasa disebut DataFrame , DataFrame sendiri adalah struktur data tabular data struktur ini memiliki sebuah key (kunci) dan value (nilai) yap seperti data dictionary contoh nya seperti ini
import pandas as pd
import numpy as np
data_diri = {
'name':['ali', 'angga', 'adi'],
'umur':['20','30','15']
}
df = pd.DataFrame(data_diri)
print(df)
data struktur yang kedua adalah adalah series, adalah struktur data object satu dimensi yang berupa kolom dengan tabel contohnya seperti ini
provinsi = ['jateng', 'jabar', 'jatim']
no_index = [1,2,3]
data_series = pd.Series(provinsi, no_index)
print(data_series)
hasilnya seperti ini
Function Pandas
Head dan Tail Function
ada beberapa function yang dapat digunakan dalam mengolah dalam struktur data DataFrame dan Series contohnya adalah fungsi head dan tail yang digunakan untuk menampilkan 5 data awal dan 5 data terakhir contoh kasusnya kita mempunyai data 20.000 angka dan kita mau ambil 5 data diawal dan 5 data terakhir contohnya seperti ini
series = pd.Series(np.random.randn(20000))
print('contoh fungsi head: ',series.head())
print('contoh fungsi tail: ',series.tail())
Function Add
fungsi ini digunakan untuk menambah dua data frame
dictionary_1 = {'A' : [5, 8, 10, 3, 9],
'B' : [6, 1, 4, 8, 7]}
dictionary_2 = {'A' : [4, 3, 7, 6, 1],
'B' : [9, 10, 10, 1, 2]}
data_frame_1 = pd.DataFrame(dictionary_1)
data_frame_2 = pd.DataFrame(dictionary_2)
data_frame_3 = data_frame_1.add(data_frame_2)
print(data_frame_1)
print(data_frame_2)
print(data_frame_3)
hasilnya seperti ini
ada beberapa fungsi lagi yang akan saya paparkan melalui studi kasus web scraping sederhana kita akan melakukan web scraping dengan pandas
pertama kita install lxml dan beautifulsoup4 dengan perintah
pip install beautifulsoup4 lxml
setelah terinstal kita lakukan scraping sederhana untuk mengambil data tabel, kali ini situs yang akan menjadi studi kasus kali ini adalah situs https://fastestlaps.com/tracks/le-mans-bugatti kita akan mengambel data dari tabel situs ini cukup buat scraping sederhana seperti ini
import pandas as pd
res = pd.read_html('https://fastestlaps.com/tracks/le-mans-bugatti')
print(res)
hasilnya seperti ini
semoga bermanfaat dan mencoba, ikuti studi kasus pandas lainya di pesonainformatika ada beberapa bahasa pemrograman lainya seperti Java, Python C++
people who use linux and people who are friendly