Tips Mengolah File Excel Menggunakan Python – pesonainformatika.com, pada kesempatan kali ini kita akan belajar mengolah data excel menggunakan python
nah langkah pertama kita harus tau modul yang digunakan, berikut, misalnya
- pandas
- openpyxl
kedua modul tersebut sering dikake untuk mengolah data baik di bidang data scraping atau data science,
kegunaannya meliputi
- memproses data
- Mengedit data
- Menghapus Data
- Menambah Data
- Manipulasi Row dan Column pada Excel
- Mengolah DataFrame (Pandas)
Pandas
oke langsung aja ke modul yang pertama yaitu pandas, pandas tersedia untuk conda dan juga pip, cara installnya
pip install pandas
atau menggunakan conda
conda install pandas
setelah terinstall buat file python baru, karena kita akan praktek menggunakan pandas
Membaca File Excel Menjadi Data Frame
kita menggunakan fungsi read_excel()
import pandas as pd
excel_data = pd.read_excel("company_data.xlsx")
# membaca kolom
id = excel_data["id"]
name = excel_data["first_name"]
data_dict: dict = {
"id": id,
"name": name,
}
print(data_dict)
mengolah dataframe pandas
ketika sudah melakukan convert kita dapat melakukan manipulasi dan melihat data serta melakukan filtering data
import pandas as pd
excel_data = pd.read_excel("company_data.xlsx")
# membaca kolom
id = excel_data["id"]
name = excel_data["first_name"]
print(id.tail(10))
itu dia cara olah data menggunakan pandas beberapa trik yang bisa diexplore balik di https://pandas.pydata.org/
Openpyxl
modul kedua ini biasa digunakan untuk mengolah file excel cara installnya bisa menggunakan pip
pip install openpyxl
dengan modul ini kita bisa mengolah file excel contohnya seperti ini
from openpyxl import load_workbook
excel_file = load_workbook('company_data.xlsx')
sheets = excel_file.active
cell = sheets.cell(1, 3)
print(cell.value)
contoh lain kita bisa menggunakan beberapa paramater untuk mendapatkan hasil yang kita inginkan contoh misalnya kita ingin mencetak nilai
from openpyxl import load_workbook
excel_file = load_workbook('company_data.xlsx')
sheets = excel_file.active
# olah data
for data in sheets.iter_cols(min_col=1, min_row=4, values_only=True):
print(data)
itu dia cara, mengolah data cara, menggunakan openpyxl, kuti terus pesonainformatika, dan dapatkan studi kasus bahasa pemrograman lainya seperti Java, Python C++
people who use linux and people who are friendly