7. týden DA

 První krůčky s pythonem

Na minulé schůzce s Kubou jsme se domluvili, že teď nastává ten pravý čas pro start práce s analýzou textu. Abych mohla text analyzovat, musím ho nejdříve zpracovat do smysluplné podoby. Od Kuby jsem se dozvěděla, že hodně zpravodajských serverů poskytuje data v tzv. RSS formátu. RSSka se nacházejí na jiné doméně, než zobrazení „pro lidi“. Pro programátory, datové analytiky a aplikace to vypadá např. takto: http://servis.idnes.cz/rss.aspx?c=zpravodaj.
Tento formát musím převést do PYTHONu (programovacího jazyka) a následně do MySQL (databáze, kde budu všechny data skladovat). Jednodušší cesta by byla přes Zappier, ale protože jsem dala slib, že to nejprve zkusím tou těžší cestou, tak ..začal googlící kolotoč.  Proč? Přece abych se co nejvíce naučila.

Přes Google jsem začala vyhledávat, jak to celé provést. Odkazů na „rss to python“ bylo hodně. Jenže většina z nich řešila něčí konkrétní problém či chybovou hlášku. Až na Youtube, cca 5. video, mi prozradilo jak na to. To byl ovšem začátek.
Při zadání příkazů dle instruktážního videa = např. feedparser, na mě vyskočila chybová hláška. A to, že tuto knihovnu nemám nainstalovanou. A tak začalo další googlící kolečko, tentokrát pro instalování dané knihovny. Chvíli to zabralo, ale povedlo se.

V terminálu/příkazové řádce jsem se musela navigovat do složky 03programming (ta, kterou používáme v DA) a aktivovat virtuální prostředí. Následovalo spuštění instalace Feedparseru pomocí příkazu: pip install feedparser.

Poté jsem se navigovala přes příkaz JUPYTER notebook do JUPYTERu a zadala další příkaz Import requests from bs4 import BeautifulSoup …a ejhle. Opět chyba, že bs4 není dostupné. Takže uložit soubor v JUPYTERu, zavřít terminál a opět se navigovat do složky a aktivovat virtuální prostředí. Spustit instalaci bs4 příkazem pip install bs4. Následně jsem ještě instalovala lxml, pro práci s xlm formáty.

Po instalaci šupky hupky zpět do JUPYTERu a zkusit naformátovat data z rss. No a vyšlo mi z toho toto! Mám obrovskou radost…tohle vypadá celkem nadějně! Teď to ještě prohnat do tabulky, do MySQL a udělat analýzu sentimentu textu 🙂 Pohoda, ne?! :))) (Panebože, jak já to udělám?! Už tohle mě potrápilo na dobré 3 hodiny. A půjde to vůbec?)

4 týdny od Meet your mentor

1 nápad

1 akademie

1 mentor

1 blonďatá

5 % zpracování projektu