Procesarea datelor din Fișiere CSV folosind Python

Configurare noua (How To)

Situatie

Vom crea un script Python care să citească date dintr-un fișier CSV, să le proceseze și să genereze un raport bazat pe acele date.

Solutie

Pasul 1: Importarea Bibliotecilor Python

Deschideți un editor de text și creați un fișier Python cu extensia “.py”. În acest fișier, importați biblioteca pandas pentru lucrul cu datele în format tabular (cum ar fi CSV-uri) și biblioteca matplotlib pentru generarea de grafice:

import pandas as pd
import matplotlib.pyplot as plt

Pasul 2: Citirea Datelor din Fișierul CSV

Definiți calea către fișierul CSV din care doriți să citiți datele și utilizați funcția “pd.read_csv()” din pandas pentru a citi datele într-un obiect DataFrame:

file_path = “path/to/your/file.csv”
data = pd.read_csv(file_path)

Pasul 3: Procesarea Datelor

Procesați datele din DataFrame după necesități. De exemplu, puteți calcula suma sau media unei coloane, puteți filtra datele sau puteți grupa datele după o anumită coloană.

# Calculul sumei unei coloane
total_sales = data[‘Sales’].sum()

# Calculul mediei unei coloane
average_price = data[‘Price’].mean()

# Filtrarea datelor
filtered_data = data[data[‘Category’] == ‘Electronics’]

# Gruparea datelor
grouped_data = data.groupby(‘Month’)[‘Sales’].sum()

Pasul 4: Generarea Rapoartelor sau Graficelor

Utilizați funcționalitatea din biblioteca matplotlib pentru a genera rapoarte sau grafice bazate pe datele procesate. De exemplu, puteți genera un grafic cu vânzările lunare sau puteți crea un tabel cu rezultatele procesării datelor.

# Generarea unui grafic cu vânzările lunare
plt.plot(grouped_data.index, grouped_data.values)
plt.xlabel(‘Month’)
plt.ylabel(‘Sales’)
plt.title(‘Monthly Sales Report’)
plt.show()

Pasul 5: Salvarea sau Afisarea Raportului

Salvați raportul într-un fișier sau afișați-l într-o fereastră grafică, după cum este necesar:

# Salvarea graficului într-un fișier
plt.savefig(‘monthly_sales_report.png’)

# Afișarea graficului într-o fereastră grafică
plt.show()

Pasul 6: Testarea și Optimizarea

Testați scriptul pentru a vă asigura că funcționează corect și că rapoartele generate sunt precise. Optimizați scriptul și procesul de prelucrare a datelor pentru a îmbunătăți performanța și eficiența.

Tip solutie

Permanent

Voteaza

(10 din 20 persoane apreciaza acest articol)

Despre Autor

Leave A Comment?