9. týden DA

Finále se blíží…komplikace sílí

V minulém týdnu jsem poctivě sbírala data ze zpráv, abych mohla udělat větší datovou analýzu. Používala jsem vytvořený skript v pythonu na čištění a sběr dat. Ty jsem poté házela do KEBOOLA connection, kde jsem díky aplikaci GENEEA získala sentiment textu zpráv. Je důležité zmínit, že GENEEA je vhodná k analýze krátkého textu, proto jsem k analýze zvolila popisek zprávy.  Z výstupů analýzy sentimentu jsem tak získala tři kategorie článků – pozitivní, neutrální a negativní. Data jsem exportovala do TABLEAU a během pár kliknutí viděla to nejdůležitější. Čísla. Jenže, v první řadě, jsem toto vše musela dělat ručně. Projet skript, uložit data z aktuálního dne, projet v KBC a uložená data zpracovat. A EJHLE! Opět mi skončila zkušební doba TABLEAU! Už ho ale do třetice (za dobu DA) neinstaluji. Vzdávám TABLEAU a vizualizaci udělám v EXCELU, případně ještě vyzkouším Google DATA STUDIO. Výcvik s další novou pomůckou? Proč ne. Však ono mi zopakování funkce COUNTIF v excelu vůbec neuškodí.

Mé domněnky se potvrzují …novináři a zpravodajské servery (a další) nás zásobují především negativními a neutrálními zprávami. Jenže…blíží se nám Vánoce. A tak servery začaly psát o Vánocích a čísla se mi mění (ne, nijak dramaticky, ale mění). Jako pozitivní zprávu GENEEA považuje např. i to, že o Vánocích se budou vysílat pohádky, atd. 🙂

Toť vše k rychlé analýze. Cíl (mobilní aplikace) je ještě daleko a musím se zase o kousek posunout dál. Už vím, že skripty fungují a že se i krkolomnou cestou dá někam dostat, ale abych došla do cíle, je potřeba udělat pár kroků a změn. V první řadě cestu zjednodušit a udělat ji efektivnější. Takže bych měla odstranit mezikrok  v podobě KBC. Vracím se tedy zpět k PYTHONu a zkouším nalézt ten správný skript pro GENEEA v PYTHONu. S velkou pomocí Verči P., je skript na světě a díky Petrovi z GENEEA i navýšený limit pro můj projekt.

Ještě taky potřebuji vyřešit uložiště. Přece všechny data nebudou u mě na počítači, že jo. 🙂 Přichází nápad od Kuby – upgradovat stránky blondata.cz a zřídit hosting. To vše je bez problému do chvíle, kdy se přihlásím ke svému účtu, abych napsala další článek. Stránky jsou naprosto prázdné!

Moje práce je fuč. Takže hezky znovu a pěkně od začátku. Učím se tvořit stránky ve WordPressu! Hezky jsem se odklonila od analýzy k programování. 🙂 Ale vlastně né až tak moc. Tvorba stránek je přece taky vizualizace, ne? 🙂

Začínám být nervózní, že vůbec nic nestihnu. Holky z DA se baví a rozebírají, kdo už co má hotové a já jsem pořád u skriptů. A to mě čeká ještě to nejtěžší. Propojit PYTHON s MySQL na hostingu, vymyslet cyklus, převést data do rss, publikovat a celé to zautomatizovat. A pak ještě ta aplikace. 🙁 To jsem si teda vymyslela zase dobrou věc 🙂