Új hozzászólás Aktív témák

  • cousin333

    addikt

    válasz pokerecske1 #353 üzenetére

    Szia!

    A Pandas modul teljesen jó a célra, mert tud két olyan dolgot, ami neked kell:
    - dátum-oszlopok beolvasása
    - dátumok újramintavételezése

    Az elsőt már a beolvasásnál érdemes aktiválni, így a dátum lesz az index:
    data = pd.read_csv('data.csv', header=None, index_col=0, parse_dates=True, names=['X', 'Y'])

    Ha sok az adat, esetleg gyorsíthat, ha még beteszed, hogy infer_datetime_format=True. Egyáltalán: jó, ha olvasgatod a read_csv metódus súgóját. Pl. a fenti sor feltételezi, hogy az index oszlop (a 0.) tartalmazza a dátumot.

    Érdemes lehet kiíratni az első pár sort, hogy lásd, mi történt:
    data.head()

    Ha van index oszlopod (ami most maga a dátum), akkor az ábrázolás innen egyszerűen:
    data.plot()

    A másik, amit szeretnél, hogy napi/óránkénti bontásban ábrázolja (vagy más osztásban), pl.:
    data.resample('H', how='mean') # óránkénti bontás
    data.resample('M', how='mean') # havi bontás

    Ábrázoláshoz egyszerűen add hozzá, hogy plot:
    data.resample('M', how='mean').plot()

    "We spared no expense"

Új hozzászólás Aktív témák