Dupa multa munca, adunat date, bagat intr-o baza de date, apoi alta serie de comenzi sql pentru rapoarte, apoi grafica siteului, in sfarsit avem datele publice la indemana oricui.
Pe scurt am luat in considerare mesajul primului ajuns la conferinta, undeva pe la ora 8 dimineata si am incheiat cu un mesaj pus chiar de mine pe #webstock10 la 12 noaptea care anunta inceperea prelucrarii rezultatelor.
Din pacate numarul foarte mare de mesaje trimise mi-a stricat putin socotelile de acasa, 2345 de tweet-uri mi-au dat multa bataie de cap deoarece api-ul de la twitter.com permite cautari pana la o adancime de 1500 de tweet-uri. Norocul a venit din partea TwitterWall-ului romanesc care mi-a fost foarte util in colectarea datelor necesare realizari statisticilor. Din pacate nu am avut acces la toate datele pe care le-as fi dorit, o evolutie pe ore a postarilor din timpul zilei si programul dupa care s-au trimis mesajele. Am totusi o poza care va poate da idee ce sa intamplat toata ziua pe ore:
De asemenea unele date erau mai greu de prelucrat in mod automat, si ma refer la numarul de mesaje adresate unui user, aici am numarat toate mesajele care contineau @user dupa care am eliminat mesajele care contineau RT-uri, ajungand la o cifra destul de exacta a mesajelor care se adresau unui user, De asemenea in campul URL am urmarit numarul de mesaje care contineau un link dar acesta este cumulat cu numarul de RT-uri care contineau si ele link.
Si ca sa nu va mai tin in suspans, statisticile le gasiti aici iar un top cu toti userii activi in timpul conferintei aici.
Cam astea fiind spuse ne vedem la urmatorul eveniment.
UPDATE: In timpul prelucrarilor am pierdut 125 de mesaje care contineau caracterul APOSTROF. Aceasta eroare a fost remediata iar schimbarile in clasament sunt minore. In top 5 twitteristi nu s-a moficat decat numarul de tweet-uri dar nu si pozitia in clasament. Procentual, in mod suprinzator a ramas aproape lafel fiind modificari doar la partea zecimala. La Top Influenta si Top RT-uri au fost cateva modificari la ultimile pozitii.
Salut, de curiozitate m-am uitat prin top si cu toate ca am 15 tweet-uri despre webstock nu apar in el. Si tot curiozitatea ma face sa intreb: cum de? :p
Adica mai exact care a fost procesul? Ai cautat doar dupa hashtag cine l-a folosit sau este ceva soft pentru asta? Eu as fi inebunit sa numar la toti cate ciripeli au…
Ce userai pe twitter?
Datele sunt parsate de pe twitterwall.ro undeva intre pagina 50 si pagina 253. Acum ca au mai aparut twitt-uri noi datele parsate de mine cred ca s-au mutat cu 20 de pagini mai la coada.
Primul post care intra in statistici e un mesaj de genul. Am ajuns al doilea la webstock dupa x care a fost primul, undeva pe 16.09.2010 la ora 8 dimineata, ultimul care e in baza de date e al meu la ora 00.03 mnute cand anuntam ca incep sa colectez datele pentru twitter effect.
@BogdiP :p
La pag 284 apare: „iulianj :))) RT @BogdiP: :)) RT @titus_k: E bine sa ai si frustrati in sala la #webstock10 . Arata cum se comporta trollii in social media.” Si atat.
Eu nu sunt in lista. Oare de ce? Tre’ sa ii intreb pe ei…
Cand le bag in baza de date pierde 120 de tweet-uri printre care si al tau. Nu-mi dau seama cu ce caractere scrieti pentru ca sunt mereu aceleasi posturi deci pur si simplu nu le baga in baza de date dintr-un motiv inca necunoscut mie.
O sa rectific si pierderea celor 120 de tweet-uri in cateva ore.
Felicitari pentru efortul si ambitia cu care ai adunat si ai realizat sistemul de statistici. Stim ca nimic nu e perfect, dar cel putin este un inceput…Eu recunosc ca nu ma pricep, dar poate se vor gasi persoane sa te ajute sa perfectionezi sistemul:)
@BogdiP Am refacut si cele 125 de posturi lipsa dar tu tot nu apari in lista si e normal sa fie asa, tweet-ul de care mi-ai zis este dat de alt user. Daca fac o lista si cu cei care au primit RT atunci sigur apari undeva pe la coada si tu.
Tweet-ul de care mi-ai zis mai sus apare inregistrat in baza de date, dar e dat de alt user, chiar daca e un RT la tweet-ul tau.