DEV Community

Cover image for Pandas data analyse (Dutch)
compilerboiler
compilerboiler

Posted on

Pandas data analyse (Dutch)

Panda's is een data-analyse module voor Python. De module werd voor het eerst ontwikkeld in 2008 en is uitgegroeid tot een van de meest populaire data-analyse modules.

Je kunt allerlei soorten data inlezen in Python met panda's.
Bijvoorbeeld het lezen van csv data (data uit txt), het inlezen van een pickle object bestand of zelfs het clipboard.

Data inlezen met panda's

Bij Panda's gaat het om data. Omdat programma's bijna altijd met data werken, is het een goede skill om de panda's-module te kennen.

Als dit uw tekstbestand is (filepath.txt, met tabs)

1 2 3
2 3 4
3 4 5
4 5 6
5 6 7

Kun je het in een pandas-dataframe inlezen met de lijnen:

import pandas as pd
dataset=pd.read_csv("filepath.txt",delimiter="\t")

Voor een csv bestand kun je het volgende doen:

data = pd.read_csv('output_list.txt', sep=",", header=None)

Je kunt de kolommen handmatig definiëren als uw gegevens geen kolommen hebben

data.columns = ["a", "b", "c", "etc."]

Je kunt dan met het dataframe werken, erop selecteren, filteren enzovoort.

Selecteer zo'n kolom:

import pandas as pd
dataset=pd.read_csv("filepath.txt",delimiter="\t")
dataset.columns = ["a", "b", "c"]
print(dataset["b"])

Dit toont al uw gegevens uit kolom A

➜ ~ python3 zoo.py
0 3
1 4
2 5
3 6
Naam: b, d-type: int64

Top comments (0)