8. týden DA

Trápení pokračuje

Tak jsem si naivně myslela, jak nemám vyhráno…Jenže jakmile jsem ale svůj výtvor chtěla dát do pandasu (knihovna v PYTHONu pro manipulaci a analýzu dat), nastal problém. Vyjížděla mi prázdná tabulka. Bez dat. Začala jsem tedy ve svém skriptu hledat chybu a přepisovat.

Metody byly různé. 🙂

Nakonec se mi podařilo správně nadefinovat proměnné a tabulka se začala plnit daty. Velká radost. Jenže, jak jsem za posledních pár dní pochopila, co se podaří v jednom kroku, neznamená to výhru. Následuje další krok, a to je zase boj. A tak neustále bojuji s příkazy a vymýšlím nové a nové variace, které mě snad dovedou do cíle.

Pomalu začínám chápat, že můj cíl – vytvořit mobilní aplikaci, je na míle vzdálený a já nemám šanci to stihnout. Každý příkaz mě doslova bolí – pálení v očích od koukání do obrazovky, záda od ajťáckého posedu u počítače, křeče v rukou od neustálého ťukání a k tomu únava z života bez spánku. Většinou totiž na projektu pracuji po škole až do rána. Taková ta 4 hodina ranní se mi stává už pravidelnou. Tělo mě začíná trestat za tyto několika hodinové neřesti.

Jenže ani to mi nezabrání k tomu, abych se vzdala. Jsem to přece já a já se nevzdávám. Krok sun krok postupuji. Někdy mi to trvá den, dva, jindy pár minut. Můj mozek se nafukuje pod přívalem spousty informací, které přicházejí z neustálého čtení blogů, článků, skriptů a koukání se na videa. Také bojuje s tím, co dělat s informacemi, které pro projekt v tuto chvíli nejsou potřebné a neřeší mou situaci. Mám pocit, že jen stojím na místě. Je načase se pohnout.

Tak po dlouhé době opět obouvám tenisky. Jde se běhat do lesa. Doufám, že potkám nějakého lesního skřítka, který mi poradí co dál. Jenže před dubem ani za dubem nikdo. Prodlužuji trasu a s dalšími kroky začínají nabíhat i nové nápady a možnosti, jak by se situace případně dala řešit.

Nové skripty už vypadají slibněji a jsou připravené na analýzu sentimentu textu. Možností je několik:

  • Prohnat dosud výsledný text GENEEA skriptem pro analýzu sentimentu textu přímo vPYTHONu.
  • Vytvořit CSV, uložit do MYSQL, kde už čeká slovník Czech SubLex 1.0 od Kateřiny Veselovské (vygoogleno a shlédnuto na YouTube) a vytvořit analýzu.
  • Celé to udělat v KEBOOLA Connection (přes GENEEA v aplikacích).
  • Udělat analýzu sentimentu přímo v PYTHONu pomocí knihoven.

No, upřímně…možností bylo ještě více, ale tyhle 4 jsem si vyzkoušela. A nemůžu říct, že všechny dobrovolně. Například první způsob mi ztroskotal na skriptu. Data byly v PANDASu a GENEEA mi projela pouze první řádek ve sloupci. Vymýšlení cyklu ne a ne se podařit. Zkusila jsem tedy další způsob, protože nemělo cenu ztrácet čas a vymýšlet další blbosti. A ještě k tomu jsem přečerpala limit demo verze. 🙂

Přeskočila jsem do KEBOOLA connection, kde práce s daty byla velmi jednoduchá. Z výsledků, které jsem už během chvilky viděla,  jsem byla nadšená. Kdyby takhle fungovaly i ty mé ubohé skripty, to by bylo programování jedna báseň.

Projela jsem si výsledky a začala používat vizualizace. Vzpomněla jsem si na jednu z přednášek pana Šlerky, kdy k vizualizaci textu použil nástroj VOYANT TOOLS. Nemohla jsem nevyzkoušet. Je to pěkná hra, ale v tomto projektu není důležitá.  Škoda, protože tohle je fakt jednoduchý a vypadá to efektně.

  Teď, když už mám data, můžu si datovou analýzou potvrdit nebo vyvrátit domněnky. Tak si začínám hrát s daty. Tak jakým negativním množstvím nás zpravodajské servery zásobují?

Výsledky z analýzy sentimentu jsem exportovala do TABLEAU, kde to bylo pěkně vybarvené. Tenhle nástroj mě baví. Je hodně uživatelsky přívětivý. Vše se dá během pár chvil naklikat. Ano, složité odpovědi na otázky trvají déle, ale já to mám velmi jednoduché. Vizualizovat se dá jakkoli, ale s měj napaměti, že i zde platí „v jednoduchosti je krása“.

 

P.S.: Tento graf je vytvořen v Excelu. Proč? Protože mi skončila zkušební doba TABLEAU a už ho do třetice (za dobu DA) nemůžu nainstalovat. Obrázků bude více, tak ať jsou všechny hezky sladěné.

Napsat komentář

Vaše emailová adresa nebude zveřejněna.