
Nota: Aceasta analiza are scop exclusiv educativ si informativ. Observatiile prezentate sunt realizate pe baza informatiilor publice disponibile si nu implica acces la date interne. Mai multe detalii pot fi gasite in pagina noastra de Disclaimer.
Am simtit ca pasesc pe teritorii noi inainte sa ma apuc initial de acest audit SEO tehnic la libertatea.ro – e un site dintr-o categorie diferita de restul auditelor care le-am facut – site de stiri vs. site-uri eccomerce.
In cele din urma e vorba despre aceleasi SEO tehnic, deci vom gasi probleme asemanatoare. De dragul transaprentei, sunt probleme prezentate in fisierul initial care au fost rezolvate la momentul scrierii acestui articol – ma refer la niste subdomenii duplicate care au fost sterse intre timp.
Pagina de comentarii separata si indexabila
Precum in auditul la Dedeman avem inca o situatie demna de categoria ‘WTF ‘ 🙂 – adica categoria unde lucrurile nu au sens. Daca cautam in Google textul de mai jos…
site:https://www.libertatea.ro/lifestyle/de-unde-vine-expresia-zarurile-au-fost-aruncate-alea-iacta-est-3665438
… vei gasi pagini create separat exclusiv pentru comentariile articolului.
In primul rand nu ar trebui sa fie create pagini separate pentru afisarea comentariilor; in al doilea rand, ne ocupam de situatie intr-un mod SEO-friendly daca nu avem optiunea sa rezolvam problema de la radacina cu solutii precum:
- Facem pagina cu comentarii neindexabila.
- Sau punem canonical catre URL cu articolul initial.
- Sau blocam orice pagina care contine’ /comentarii‘ in fisierul robots.txt.
Care crezi ca e solutia aleasa dintre cele 3? Paginile duplicate cu comentarii sunt de fapt indexabile si au canonical catre o pagina 404 care nu exista!
Cu alte cuvinte, au aplicat o ‘solutie’ care face problema initiala o problema mai complicata.
Mai mult, daca sunt un numar mai mare de comentarii se creaza mai mult de 2 pagini indexabile. In exemplu vedem o a doua pagina de comentarii ‘/comment-page-2‘ – in total 3 pagini cu URL unice si indexabile pentru acelasi articol.
- Pont SEO: Pentru a vizualiza URL-ul intreg in rezultatele Google foloseste extensia Chrome - Remove Breadcrumbs.
Cum dauneaza acest comportament
Prin aceste pagini extra cu comentarii, Google e acum fortat sa indexexe pagini extra care nu aduc neaparat valoare utilizatorului – ceea ce poate influenta negativ calitatea site-ului in ‘ochii’ lui Google.
De asemenea – acest setup dauneaza experientei utilizatorului in mod direct – daca vreau sa vad comentariile postate unui articol trebuie sa apas pe butoane de paginiatie sa vad comentariile, sau daca vreau sa ma duc inapoi la articol.
Pe langa asta, daca esti utilizator Google, sunt sigur ca ai observat site-uri precum reddit si quora clasate frecvent in primele pozitii – asta pentru ca Google pune valoare mare pe UGC (user generated content).
Avand comentariile pe alta pagina decat pagina articolului, practic spunem lui Google ca acel UGC din comentarii nu au legatura cu articolul – astfel devalorizam valoarea comentariilor ca element SEO care au potential o influenta pozitiva asupra clasarilor.
Cum as rezolva eu problema
Personal as face tot posibilul sa pun comentariile pe aceeasi pagina cu articolul si astfel nu doar s-ar rezolva orice problema ci ar ajuta articolul sa fie clasat mai bine, cel putin in teorie.
Daca aceasta optiune nu este posibila, atunci as crea o directiva globala pentru paginile cu comentarii sa fie canonicalizate de articol.
Pagini goale create doar cu imagini
O problema descoperita ulterior este o problema clasica cauzata de WordPress si plugin-ul Yoast – se creaza automat pagini unice pentru fiecare imagine incarcata pe site. Daca ne uitam la URL-ul de mai jos …
https://www.google.com/search?q=site:www.libertatea.ro+%22Un+mare+talent+al+tenisului+tricolor+se+stinge+%C3%AEn+Cipru:%22+inurl:attachment&num=100&sca_esv=5791a0164e19b13c&sxsrf=AHTn8zrX6iO0sHiVu9vT4-BcuWtL4DnrLg:1737641553843&filter=0&biw=2124&bih=1031&dpr=0.9
… vedem aici nu mai putin de 16 URL-uri unice cu exact acelasi titlu – pagine goale cu imaginile incarcate pe articolul unde sunt postate imaginile.
E pacat ca avem aceasta problema pe un site imens precum libertatea.ro – cu cat mai mare site-ul cu atat probleme de genul pot afecta mai mult.
Impactul negativ e unul precum cel din problema anterioara – se creaza un index bloating imens din cauza acestor pagini care cel mai probabil dauneaza performantei SEO.
Cealalta problema este canibalizarea – am gasit o pagian goala doar cu o imagine care rankeaza mai sus de articolul asociat cu imaginea. Practic utilizatorul ajunge pe aceasta pagina goala fara posibilitatea de a vedea insasi articolul care il cauta.
Video facut doar pentru aceasta problema
In baza la ahrefs, sunt un total de 8,864 de pagini goale doar cu imagine. Desi primesc trafic, multe din aceste pagini probabil canibalizeaza variantele de pagini cu continut complet – nu sunt asa multe cautari in care utilizatorul sa vrea sa vada doar o imagine.
Alte probleme SEO tehnice gasite
In continuare voi lista alte probleme de tip SEO tehni gasite pe site. Cea mai mare este evident cea mai sus insa si urmatoarele merita atentia cuvenita.
URL-uri cu extensie .html inca indexate
In sectiunea pagini care nu ar trebuie sa fie indexate avem si aceste pagini de pe un CMS vechi care au extensia .html – desi avem redirect facut corect de pe pagina .html catre alternativa noua a paginii, pare ca ceva intarzie sau previne deindexarea acesteia.
Nu am gasit internal links si nici backlinks catre pagina .html din poza dar este totusi posibil sa fie backlinks spre exemplu de pe un site sau pagina neinregistrata de ahrefs (precum social media).
site:libertatea.ro filetype:html
Subdomenii cu erori (partial rezolvate)
In fisierul initial cu problemele SEO tehnice gasisem mai multe subdomenii cu erori. La momentul producerii video-ului acele probleme erau in curs de rezolvare iar acum sunt deja rezolvate. Poti vedea dovada problemei aici in video la minutul 07:00.
Pe scurt, am gasit mai multe domenii care erau duplicate, unul parea a fi a fi o sectiune dedicata pentru ‘Rebus‘, iar apoi alt subdomeniu pentru ceva numit ‘Intrebarea Zilei‘ – aceste subdomenii erau duplicate pe dar au fost deja complet eliminate si deindexate.
Insa se pare ca unul din aceste subdomenii le-a scapat – o pagina dedicata unui concurs ING. E un mini-site de o pagina cu un fisier pdf si o pagina ‘Hello World‘ :).
site:ing-young-quiz.libertatea.ro/
Multe pagini .pdf redundante
La alte audituri precum cel de la Farmacia Tei unde am gasit pdf-uri multe cu prospecte poti face un argument ca e OK sa fie indexate – insa la libertatea.ro mi se par si mai irelevant ca aceste pagini sa fie indexate.
Nu par a servi nici o cautare si nu sunt in primul rand optimizate pentru Google, au titluri generate automat intrucat nu sunt optimizate pentru motor de cautare.
site:libertatea.ro filetype:pdf
Site-ul pare sa atinga frecvent limita de trafic
O problema unica dar care poate avea consecinte mari e faptul ca mi s-a intamplat de cel putin 3 ori sa nu pot vizita pagini de pe site – motivul fiind ‘429 Too Many Requests‘.
Este posibil sa fie activat rate limit-ul din cauza ca am folosit acele extensii chrome care verifica status code-ul la toate link-urile de pe pagina.
Insa sunt sanse sa fie o problema declansata si pentru alti utilizatori – cand am incercat sa accesez site-ul de pe un alt IP am primit din nou eroarea.
In acelasi timp am incercat sa accesez site-ul meu si totul mergea normal – site-ul meu era accesibil, iar site-ul libertatea a afisat eroare.
Redirect chain la homepage
Parte din SEO de baza, e bine sa evitam orice redirect chains, mai ales cele catre pagina principala a site-ului.
O problema relativ comuna, varianta non-https http://libertatea.ro/ face intai 301 redirect catre https://libertatea.ro/ si abia apoi merge la varianta cu www.
- Pont SEO: Pentru a vedea detaliile 301 redirect si 404 mai multor link-uri foloseste site-ul httpstatus.io.
301 redirect in footer
Tot in aceeasi categorie avem si un 301 redirect in sectiunea footer a site-ului – o problema gasita pana acum pe toate celelalte site-uri analizate, cele mai multe fiind gasite in auditul facut lui dedeman.ro.
Fiind doar 1 astfel de link e de laudat avand in vedere ca toate celeleate site-uri analizate avrau cel putin 2.
Mai mult, chiar si acest 301 redirect e catre un link extern, ceea ce e mai putin grav decat deca ar fi fost un 301 intern.
Alte mici probleme gasite
In continuare voi lista pe scurt alte mici probleme gasite care sunt de o prioritate foarte mica.
- Un sitemap.xml care nu arata toate paginile site-ului ci arata doar un numar limitat de articole - vezi aici.
- Niste fisere format .xls indexate si un fisier format .txt indexat.
- Pagini cu imagini de tip placeholder images - par a fi pagini vechi fara imagini care in urma schimbarii CMS-ului sau temei site-ului s-a aplicat sablonul cu imagini peste postari fara imagini - exemplu aici sau aici.
Ce lucruri pozitive am gasit?
Am vorbit mult doar de lucruri negative. Insa e timpul sa incerc sa scot in evidenta si lucrurile pozitive.
- Sitemap bine structurat: Pe pagina https://www.libertatea.ro/news-sitemap avem un sitemap exemplar cu pagini structurate intr-un mod super intuitiv de navigat pentru utilizatori.
- Pagini de profil celebritati: Avem pagini de profil detaliate cu recomandare continut dinamic relevant persoanei prezentate, precum cel de aici: /persoana/donald-trump.
- Numar foarte mic de erori 404: Pentru un site imens precum libertatea.ro am gasit un total de doar 19 link-uri externe care sunt 404 - ca comparatie, in auditul de la Dr. Max avem 160 astfel de erori.
Concluzie
In final, am avut o impresie general pozitiva despre ce fac cei de la libertatea.ro din punct de vedere SEO. Problema cu paginile create la comentarii care e cam singura problema dubioasa care poate dauna intr-o anumita masura.
Problema cu paginile .html duplicate indexate pare a fi o problema temporara intrucat in teorie acele pagini ar fi trbuit sa fie deindexate de Google.
Problema cu inaccesarea site-ului din cauza erorii ‘429 To many requests‘ e cel mai probabil declansata doar pentru mine. Insa e interesant ca pana acum nu am avut problema asta la niciunul dintre celelate site-uri care le-am analizat prin exact acelasi proces.
Asadar, cum ti s-a parut aceasta analiza SEO tehnica? E ceva ce ti-a atras atentia, sau ceva ce crezi ca poate fi imbunatatit in acest audit? Lasa-mi un mesaj in sectiunea de comentarii de mai jos.
Esti interesat de acest tip de servicii SEO? Viziteaza pagina mea cu serviciul Audit SEO Tehnic sau daca vrei ceva mai complet ofer si audite SEO avansate.
Ma numesc Andrei si sunt implicat in SEO 2013 iar in 2014 am facut pentru prima oara $1000 intr-o luna cu propriile site-uri. Astazi vreau sa ridic nivelul calitatii de servicii SEO din Romania prin servicii SEO calitative si prin tutoriale SEO. Pentru tutoriale video te invit pe canalul meu de youtube.