Analiza directoarelor web

Ianuarie 19, 2010 Lasă un comentariu

Gasim pe internet multe liste de directoare web (romanesti sau straine), ordonate dupa PR. Problema este insa, ca in mare majoritate, aceste liste prezinta valori false la valoarea PR-ului.

Am creat un script PHP, care va analiza un fisier HTML, care contine o lista de linkuri de directoare web. Scriptul va obtine PR-ul fiecarui director (link) din aceasta lista de linkuri, si va ordona lista dupa valoare PR-ului.
Sigur ca in alegerea directoarelor nu numai PR-ul directorului are un rol deosebit. Pentru mai multe detalii, cititi acest articol.

Pentru test, am cautat o pagina de pe net, care a oferit o lista de directoare web. Am coptiat linkurile de pe pagina, intr-un fisier numit „db1.html”, si am salvat in acelasi director cu urmatoarele doua scripturi php.

SCOPUL ACESTUI TEST NU A FOST SA VA PREZINTE DIRECTOARE WEB DE CALITATE, CI SA PUTETI ANALIZA SI ORDONA IN MOD RAPID O LISTA DE DIRECTOARE.
Lista a fost luata de pe pagina http://www.heliosdesign.ro (Mi sa parut o lista de incredere.)

directory_analizer.php

<?php
set_time_limit(0);
include("pagerank.php");
?>

<?php
//list of html files
$lp = array('db1.html');

$directories = array();
$prs = array();

//scan these files
foreach ($lp as $page) {
	$content = @file_get_contents($page);
	preg_match_all ("/a[\s]+[^>]*?href[\s]?=[\s\"\']+"."(.*?)[\"\']+.*?>"."([^<]+|.*?)?<\/a>/", $content, $matches);
    $matches = $matches[1];
    foreach($matches as $var)
    {
       if (!in_array($var,$directories)) if (strlen($var) < 60) $directories[] = $var;
    }
}

foreach ($directories as $dir) {
	usleep(100);
	$pr = getPageRank($dir);
	$prs[] = $pr;
}

array_multisort($prs, SORT_DESC, SORT_NUMERIC, $directories, SORT_STRING, SORT_ASC);

echo '<html>';
echo '<table>';
for ($i = 0; $i < sizeof($prs); $i++) {
	echo '<tr><td>'.$directories[$i].'</td><td>'.$prs[$i].'</td></tr>';
}
echo '</table>';
echo '</html>';
?>

iar fisierul pagerank.php:

<?php
function StrToNum($Str, $Check, $Magic)
{
    $Int32Unit = 4294967296;
    $length = strlen($Str);
    for ($i = 0; $i < $length; $i++) {
        $Check *= $Magic;
        if ($Check >= $Int32Unit) {
            $Check = ($Check - $Int32Unit * (int) ($Check / $Int32Unit));
            $Check = ($Check < -2147483648) ? ($Check + $Int32Unit) : $Check;
        }
        $Check += ord($Str{$i});
    }
    return $Check;
}

function HashURL($String)
{
    $Check1 = StrToNum($String, 0x1505, 0x21);
    $Check2 = StrToNum($String, 0, 0x1003F);
    $Check1 >>= 2;
    $Check1 = (($Check1 >> 4) & 0x3FFFFC0 ) | ($Check1 & 0x3F);
    $Check1 = (($Check1 >> 4) & 0x3FFC00 ) | ($Check1 & 0x3FF);
    $Check1 = (($Check1 >> 4) & 0x3C000 ) | ($Check1 & 0x3FFF);
    $T1 = (((($Check1 & 0x3C0) << 4) | ($Check1 & 0x3C)) <<2 ) | ($Check2 & 0xF0F );
    $T2 = (((($Check1 & 0xFFFFC000) << 4) | ($Check1 & 0x3C00)) << 0xA) | ($Check2 & 0xF0F0000 );
    return ($T1 | $T2);
}

function CheckHash($Hashnum)
{
    $CheckByte = 0;
    $Flag = 0;
    $HashStr = sprintf('%u', $Hashnum) ;
    $length = strlen($HashStr);
    for ($i = $length - 1;  $i >= 0;  $i --) {
        $Re = $HashStr{$i};
        if (1 === ($Flag % 2)) {
            $Re += $Re;
            $Re = (int)($Re / 10) + ($Re % 10);
        }
        $CheckByte += $Re;
        $Flag ++;
    }
    $CheckByte %= 10;
    if (0 !== $CheckByte) {
        $CheckByte = 10 - $CheckByte;
        if (1 === ($Flag % 2) ) {
            if (1 === ($CheckByte % 2)) {
                $CheckByte += 9;
            }
            $CheckByte >>= 1;
        }
    }
    return '7'.$CheckByte.$HashStr;
}

function getPageRank($url) {
        $agents = array(
                    'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30',
                    'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.9',
                    'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.8',
                );
    $useragent = @ini_get('user_agent');
    @ini_set('user_agent', $agents[array_rand($agents)]);
    $ch = CheckHash(HashURL($url));
    $pr_url ="http://toolbarqueries.google.com/search?client=navclient-auto&ch=$ch&features=Rank&q=info:$url";
    $data = file_get_contents($pr_url);
    @ini_set('user_agent', $useragent);
    $pos = strpos($data, "Rank_");
    if($pos !== false)
    {
        $pr = trim(substr($data, $pos + 9));
        return str_replace("\n",'',$pr);
    }
    else
        return 0;
}
?>

Iar rezultatul a fost urmatoarea:

http://www.federal.ro/ 6
http://www.firmeromania.ro/ 6
http://www.immromania.ro/ 6
http://www.kappa.ro/ 6
http://www.linkuri.ro/ 6
http://www.roportal.ro/ 6
http://www.smarty.ro/ 6
http://webdirectory.rol.ro/ 5
http://www.adresa.ro/ 5
http://www.afla.ro/ 5
http://www.apropo.ro/ 5
http://www.cere.ro/ 5
http://www.e-oferta.ro/ 5
http://www.ghidul.ro/ 5
http://www.index2000.ro/ 5
http://www.legaturi.ro/ 5
http://www.paginialbastre.ro/ 5
http://www.ponturifierbinti.com/ 5
http://www.promovare-site.ro/ 5
http://www.tre.ro/ 5
http://www.adirector.ro/ 4
http://www.bizcity.ro/ 4
http://www.director-web.santamia.ro/ 4
http://www.ghidafaceri.ro/ 4
http://www.idilis.ro/catalog/ 4
http://www.indexb.ro/ 4
http://www.info-romania.ro/ 4
http://www.infofirme.ro/ 4
http://www.prestariservicii.ro/ 4
http://www.publionline.ro/ 4
http://www.repertoar.ro/ 4
http://www.roinfo.biz/ 4
http://www.top1.ro/ 4
http://www.top300.ro/ 4
http://www.trafix.eu/ 4
http://portal.adstart.ro/ 3
http://www.24biz.ro/ 3
http://www.adauga-site.eu/ 3
http://www.adauga.com/ 3
http://www.director-web.net/ 3
http://www.dyr.ro/ 3
http://www.epagini.com/ 3
http://www.euroghid.com 3
http://www.firmeonline.ro/ 3
http://www.haabaa.ro/ 3
http://www.hotstop.ro/ 3
http://www.ldmstudio.com/ 3
http://www.links24.ro/ 3
http://www.memo.ro/ 3
http://www.prodirector.net/ 3
http://www.resurse.com/ 3
http://www.roindex.ro/ 3
http://www.seo-portal.ro/ 3
http://www.top40.ro/ 3
http://www.totaltop.ro/ 3
http://www.webe.ro/ 3
http://www.webindex.ro/ 3
http://www.westinfo.ro/ 3
http://www.wol.ro/ 3
http://www.aix.ro/ 2
http://www.amical.ro/ 2
http://www.atat.ro/ 2
http://www.butic.eu/ 2
http://www.cazare-romania.info 2
http://www.cuvinte.info/ 2
http://www.deconstructii.com/ 2
http://www.directorulweb.com/ 2
http://www.elinks.ro/ 2
http://www.euro-web-directory.com/ 2
http://www.firme-companii.ro/ 2
http://www.informatii24.ro/ 2
http://www.lynk.ro/ 2
http://www.myguide.ro/ 2
http://www.optimizare-site.com/ 2
http://www.portal.ro/ 2
http://www.topdirectorweb.ro/ 2
http://www.univers-web.ro/ 2
http://www.whr.ro/ 2
http://www.enigma.ro/ 1
http://director.domedia.ro/ 0
http://directorweb.itbox.ro/ 0
http://selectii.ro/ 0
http://www.acidlinks.com/ 0
http://www.adauga-url.com/ 0
http://www.add-url.ro/ 0
http://www.astazi.net/ 0
http://www.bumerang.ro/ 0
http://www.director-seo.org/ 0
http://www.directorfirme.ro/ 0
http://www.epweb.ro/director-web/ 0
http://www.evrika.ro/ 0
http://www.index-romania.info/ 0
http://www.murfi.com 0
http://www.rank-up.ro 0
http://www.ro-pix.com/ 0
http://www.rodirector.ro/ 0
http://www.rohit.ro/ 0
http://www.romania-worldwide.info/ 0
http://www.topdirector.net/ 0
http://www.webdb.ro/ 0
http://www.webdirinfo.ro/ 0
http://www.xchange.ro/site/ 0

PHP pagerank checker, bazat pe Google Toolbars

Ianuarie 19, 2010 Lasă un comentariu

Am sa prezint si o alta varianta pentru obtinerea pagerank-ului prin php.
Aceasta versiune „simuleaza” un utilizator, care foloseste un browser Mozilla.

<?php
function StrToNum($Str, $Check, $Magic)
{
 $Int32Unit = 4294967296;
 $length = strlen($Str);
 for ($i = 0; $i < $length; $i++) {
 $Check *= $Magic;
 if ($Check >= $Int32Unit) {
 $Check = ($Check - $Int32Unit * (int) ($Check / $Int32Unit));
 $Check = ($Check < -2147483648) ? ($Check + $Int32Unit) : $Check;
 }
 $Check += ord($Str{$i});
 }
 return $Check;
}

function HashURL($String)
{
 $Check1 = StrToNum($String, 0x1505, 0x21);
 $Check2 = StrToNum($String, 0, 0x1003F);
 $Check1 >>= 2;
 $Check1 = (($Check1 >> 4) & 0x3FFFFC0 ) | ($Check1 & 0x3F);
 $Check1 = (($Check1 >> 4) & 0x3FFC00 ) | ($Check1 & 0x3FF);
 $Check1 = (($Check1 >> 4) & 0x3C000 ) | ($Check1 & 0x3FFF);
 $T1 = (((($Check1 & 0x3C0) << 4) | ($Check1 & 0x3C)) <<2 ) | ($Check2 & 0xF0F );
 $T2 = (((($Check1 & 0xFFFFC000) << 4) | ($Check1 & 0x3C00)) << 0xA) | ($Check2 & 0xF0F0000 );
 return ($T1 | $T2);
}

function CheckHash($Hashnum)
{
 $CheckByte = 0;
 $Flag = 0;
 $HashStr = sprintf('%u', $Hashnum) ;
 $length = strlen($HashStr);
 for ($i = $length - 1;  $i >= 0;  $i --) {
 $Re = $HashStr{$i};
 if (1 === ($Flag % 2)) {
 $Re += $Re;
 $Re = (int)($Re / 10) + ($Re % 10);
 }
 $CheckByte += $Re;
 $Flag ++;
 }
 $CheckByte %= 10;
 if (0 !== $CheckByte) {
 $CheckByte = 10 - $CheckByte;
 if (1 === ($Flag % 2) ) {
 if (1 === ($CheckByte % 2)) {
 $CheckByte += 9;
 }
 $CheckByte >>= 1;
 }
 }
 return '7'.$CheckByte.$HashStr;
}

function getPageRank($url) {
 $agents = array(
 'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 1.1.4322; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30',
 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.9',
 'Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.1.6) Gecko/20070725 Firefox/2.0.0.8',
 );
 $useragent = @ini_get('user_agent');
 @ini_set('user_agent', $agents[array_rand($agents)]);
 $ch = CheckHash(HashURL($url));
 $pr_url ="http://toolbarqueries.google.com/search?client=navclient-auto&ch=$ch&features=Rank&q=info:$url";
 $data = file_get_contents($pr_url);
 @ini_set('user_agent', $useragent);
 $pos = strpos($data, "Rank_");
 if($pos !== false)
 {
 $pr = trim(substr($data, $pos + 9));
 return str_replace("\n",'',$pr);
 }
 else
 return 0;
}
?>

iar testul

<?php
 include('pagerank.php');
 $pr = getPageRank('google.com');
 echo 'Google are PR  '.$pr;
?>

Cateva idei despre directoare web

Ianuarie 19, 2010 1 comentariu

Cum am precizat in tutorialul despre optimizare pentru Google, nu numai cantitatea dar si calitatea linkurilor catre site-ul dvs. este important.

Primul pas intodeauna este, sa detineti un site de calitate. Degeaba incercati sa promovati un site care nu ofera informatii utile pentru vizitatori. Un site de calitate si de incredere va transforma vizitatorii in clienti, si va fi mult mai usor acceptat in directoarele mari din tara, sau din strainatate.

IMORANT!
Mai mentionez inca odata – cum a fost descris si in tutorial – ca pentru transferul pagerank-ului nu numai directorul trebuie sa aiba un PR cat mai mare, dar si pagina din cadrul directorului pe care site-ul dvs. va fi listat. Pozitia linkului in cadrul acestei pagini este la fel importanta. Daca va inscrieti site-ul in multe directoare web, va sfatuim sa nu folositi aceeasi titlu si descriere. Este indicat sa aveti 5-6 variante, pe care le combinati.

La fel este indicat sa gasiti – pe langa directoarele web generale – si directoare web specifice (de ex. sunt directoare numai pentru site-uri de business, arta, etc.)

Inscrierea in unele directoare necesita crearea unui cont, sau backlink, altele nu. Alegerea directoarelor in care veti inscrie site-ul, ramana la atitudinea dvs.

Semi automatizarea inscrierilor
Fiindca aproape pentru fiecare director web, trebuie completati aceeasi campuri, puteti folosi un program de gen auto-filler.
Un exemplu de program (mai bine zis add-on pentru mozilla) gasiti aici.

Sumar – Optimizare Google

Ianuarie 18, 2010 1 comentariu

Optimizarea si promovarea site-ului dumneavoastra nu este o munca care treuie facuta o data. Trebuie sa lucrati flux continuu la el, insa acest efort cu siguranta va merita. Un site cunoscut, bine promovat, si usor de gasit in motoarele de cautare, aduce clienti, iar clientii aduc bani. In acest tutorial am prezentat partea teoretica a optimizarii pentru Google, si am incercat sa dam sfaturi ce va pot fi utile. Sigur ca in realitate obtinerea rezultatelor este mult mai dificila decat a invata teoria. De aceea este indicat sa cereti ajutorul unor experti, care in afara de cunostintele din domeniu, au idei noi, deja puse in practica.

Factori off-page – Optimizare Google

Ianuarie 18, 2010 1 comentariu

4. Factori off-page

Cum am mai precizat, linkurile de pe alte site-uri catre site-ul dumneavoastra determina importanta paginii dumneavoastra Cantitatea si “puterea” acestor linkuri determina PageRank-ul (PR) site-ului.

4.1. Calcularea PageRank-ului


Notiunea de PageRank a fost introdus de Google. Oamenii de obicei prin valoare de PageRank se gandesc la un numar intre 0 si 10. Intr-adevar toolbar-ul Google, sau calculatoarele online de PageRank afiseaza un numar in acest interval. Nu stim exact care este formula prin care se transforma valoarea reala a PageRank-ului (care, daca analizam formula PR-ului, observam ca poate avea valori peste 100.000.000+) in scara 0-10, dar tindem sa credem (statisticile sustin acest lucru) ca are loc o transformare printr-o scara logaritmica (de exemplu in baza 10). Asta inseamna ca este mult mai greu sa urcati PR-ul de la 5 la 6, decat de la 1 la 2. In calcularea PR-ului si linkurile externe(linkuri catre site de pe alte site-uri), si linkurile interne sunt luate in considerare..
Formula PR-ului este urmatoarea:

PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn))

unde,

– t1 … tn sunt paginile care au un link catre pagina A;

-C(t1) … C(tn), sunt numarul de linkuri de pe pagina t1 … tn;
-d, factor de amortizare, de obicei are valoarea 0.85;

Nu uitati ca fiecare pagina din cadrul site-ului are un PR. Prin structurarea corecta a paginilor, puteti obtine ca paginile principale sa aiba PR-ul cel mai mare. Puteti sa incercati pe baza formulei, cum se schimba PR-ul fiecarei pagini, daca schimbati structura de interconectare a lor. PR-ul site-ului intreg este suma PR-urilor pentru fiecare pagina.

4.2. Calitatea si cantitatea linkurilor externe;

Calitatea linkurilor externe;

Puteti avea mii de linkuri externe catre pagina dumneavoastra, dar daca aceste linkuri de pe celalalte pagini nu includ cuvintele cheie principale pentru site-ul dumneavoastra atunci acest lucru nu va este de folos in mod semnificativ. Cazul ideal, si cel mai apreciat de Google este, daca in text-ul linkului de pe pagina A, apar cuvintele cheie paginii B, catre care linkul a fost creat, si pagina A si B au aceeasi tema (ambele sunt optimizate pentru aceleasi cuvinte cheie).

Cantitatea si “puterea” linkurilor externe;

Page Rank-ul este un factor important pentru o buna pozitie in Google, dar exista site-uri cu PR peste 7 care totusi sunt greu de gasit pe Google pentru ca nu sunt bine optimizate pentru cuvintele cheie, si/sau cuvintele cheie nu au fost bine alese. Atfel multe site-uri cu PR 3 sau 4 sunt listate inaintea acestor site-uri. Prin aceasta am dorit sa accentuam faptul, ca obtinerea unui PR mare, este un factor important, dar nu neaparat cel mai important (conditie necesara, dar nu si suficienta). Chiar daca – cum am precizat – prezenta cuvintelor cheie in linkurile externe catre pagina dumneavoastra este importanta, acest lucru nu are de-a face cu PR-ul site-ului.

PR-ul depinde doar de cantitatea si puterea linkurilor externe. Cu cat, o pagina care contine un link catre site-ul dumneavoastra are un PR mai mare, cu atat mai bine. “Puterea” unui link extern catre pagina dumneavoastra este in cazul ideal 85% din PR-ul site-ului care contine link-ul, dar acest numar se decrementeaza in functie de numarul altor linkurilor de pe aceea pagina. Aceasta inseamna ca un link catre site-ul dumneavoastra de pe o pagina cu PR 4 si  cu putine (alte) linkuri catre alte pagini, poate sa fie mai “puternic” decat un link de pe o pagina cu PR 6 si multe alte linkuri catre alte pagini. Pe baza formulei PR-ului acest lucru este usor de evidentiat. Insumand toate cele spuse in acest subcapitol, trebuie sa incercati sa faceti rost de multe linkuri de calitate si puternice, catre site-ul dumneavoastra

4.3. Inscriere in directoare web;

Inscrierea in directoare web este probabil cea mai buna metoda pentru a obtine un PR pentru site-uri noi, rapid. In aceste directoare site-ul dumneavoastra va fi adaugat si listat intr-o categorie, si subcategorie anume, in functie de tema site-ului dumneavoastra. Este important ca pagina din cadrul directorului web, care va contine un link catre site-ul dumneavoastra sa aiba un PR cat mai mare, astfel si link-ul va fi mai puternic. Unul dintre cele mai importante directoare web, este DMOZ-ul (sau ODP), pe care il gasiti pe adresa: http://www.dmoz.org/, sau http://www.dmoz.org/World/Română/ versiunea in romana. Probabil va lua saptamani/luni pana veti fi listati in acest director, fiindca acceptarea noilor site-uri se face manual, de catre asa numiti “editori”, care sunt responsabili pentru o categorie anume din cadrul directorului.
Cand cautati dupa directoare web, uitati-va daca in acel director gasit, linkurile spre celelalte site-uri au atributul “rel” cu valoarea “nofollow”. In acest caz, degeaba are acel director un PR mare, pentru ca, crawlerul nu va urmari acel link, cu alte cuvinte din punct de vedere SEO nu va ajuta cu nimic. Pentru o lista cu directoare romanesti si straine, vizitati pagina: https://ptamas.wordpress.com/.
Cateva sfaturi legate de obtinerea linkurilor catre site-ul dumneavoastra

– daca faceti schimb de linkuri cu un alt site, acest site sa aiba tema asemanatoare cu site-ul dumneavoastra si sa includa cuvintele cheie ale dumneavoastra in textul linkului;

– concentrate-va eforturile pentru obtinerea linkurilor dinspre site-uri cu PR >= 4. Nici linkurile de pe site-uri cu PR <= 3 nu va influenta PR dumneavoastra in mod negativ, dar nici nu vor aduce rezultate rapide. Totusi sunt importante si aceste linkuri, pentru ca s-ar putea ca aceste site-uri sa obtine un PR mai mare cu timpul;

– cand postati pe forumuri, includeti adresa site-ului dumneavoastra in semnatura;

– stati departe de fermele de linkuri, cei care ofera “bulk links”;

– inscrierea in directoarele web sa o faceti manual, si faceti o statistica in care ati fost acceptati, si in care nu;

– analizati site-urile competente, care sunt listate inaintea site-ului dumneavoastra in Google. Aceasta analiza va poate da idei noi de promovare;

– faceti-va auziti si in afara site-ului dumneavoastra principal. E bine sa aveti un blog, sa postati articole despre produsele/serviciile dumneavoastra. Astfel veti fi reprezentati pe mai multe site-uri, si veti avea locuri unde sa includeti linkuri catre site-ul principal;

Factori on-page – Optimizare Google

Ianuarie 18, 2010 1 comentariu

3. Factori on-page

In acest capitol vom vorbi despre cuvintele cheie, ce sunt ele, si cum sa alegeti cuvintele cheie potrivite.  Pe langa faptul ca pare sa fie un lucru usor de facut, alegerea corecta a “keyword”-urilor, necestita atentie la detalii, si un brainstorming serios. Alte subiecte abordate vor fi structurarea corecta a paginilor, optimizarea site-ului pentru cuvinte cheie (unde si cum sa folositi aceste keyword-uri), si vom prezenta conectarea corecta a paginilor.

3.1. Cuvintele cheie (keywords);

3.1.1. Ce sunt cuvintele cheie;

Cuvintele cheie sunt acele cuvinte pe care le tasteaza o persoana in motorul de cautare, cand incearca sa gaseasca o anumita informatie. Cum am mai precizat, majoritatea persoanelor tasteaza intre 2-5 cuvinte la o cautare. Cuvintele cheie pentru pagina dumneavoastra vor fi acele cuvinte, care alcatuiesc cea mai relevanta fraza de cautare, prin care doriti ca site-ul propriu sa fie gasit. Aceste cuvinte cheie trebuie sa fie specifice si descriptive.  Aici trebuie precizat un aspect important: este mai bine sa aveti 100 de vizitatori, pe pagina dumneavoastra care v-au gasit intr-un motor de cautare, printr-un termen de cautare mai particular (mai putin general), decat sa aveti 1000 de vizitatori, care v-au gasit cautand dupa un termen mai general. Acei 100 de vizitatori, probabil chiar vor gasi ce au cautat pe site-ul dumneavoastra, generand astfel o rata de clienti noi/vizitatori mai mare.

3.1.2. Alegerea cuvintelor cheie;

Regula #1 in alegerea cuvintelor cheie este urmatoarea: Ganditi la fel ca si clientii dumneavoastra, adica ce cuvinte ati introduce in Google, pentru a cauta anumite produse/servicii pe care firma dumneavoastra le ofera. Pare sa fie ceva usor de facut, si totusi majoritatea webmasterilor, sau firmelor gresesc la pasul acesta. Multi folosesc numele firmei, sau eventual sloganul firmei in postura de cuvinte cheie. Dar ganditi-va cati oameni stiu despre firma dumneavoastra? Un astfel de site, va fi gasit doar de cei care stiu despre firma in cauza, iar rolul prezentei pe internet, este aducerea de noi clienti.

Va sugeram folosirea unei unelte, de la Google, care va arata, cate cautari au fost facute dupa un anumit termen, si va sugereaza cuvinte cheie alternative. Incercati sa gasiti cuvinte cheie, dupa care s-au facut mai multe cautari, dar totusi descriptive si specifice! Pentru detalii accesati: https://adwords.google.com/select/KeywordToolExternal

Pentru a intelege logica alegerii cuvintelor cheie, vom lua un exemplu concret. Sa zicem ca firma dumneavoastra se ocupa cu vanzari de imobiliare. Astfel putem avea o multima de cuvinte cheie: vanzari imobiliare, oferta imobiliare , vanzari apartamente, vanzari case, vanzari garsoniere, etc. Vom alege o fraza de cuvinte cheie primara, si una secundara. In optimizare vom folosi pe ambele, doar ca pe cea secundara, o folosim mult mai rar.

Pasul 1. Alegerea frazei primare de cuvinte cheie. Aceasta trebuie sa fie o fraza (2-5 cuvinte) ce o sa apara pe fiecare pagina a site-ului. Noi vom alege ca fraza primara : vanzari imobiliare. Daca faceti o cautare dupa aceasta fraza pe Google, o sa vedeti ca, exista aproximativ 2.750.000 de rezultate. Asta inseamna, ca vor exista 2.750.000 site-uri concurente. Daca o persoana cauta imobiliare (sau orice alt produs care este legat de o anumita localitate), cel mai probabil o sa specifice si o zona geografica. Sa zicem, ca firma dumneavoastra vinde imobiliare in Cluj Napoca. Astfel putem schimba fraza noastra primara, care acum va fi: vanzari imobiliare Cluj Napoca. Iar pentru aceste cuvinte cheie Google-ul returneaza 599.000 de rezultate. Aproape de 5 ori mai putine site-uri concurente.

Pasul 2. Alegerea frazei secundare de cuvinte cheie. Acesta va fi un fel de varianta alternativa, pentru fraza primara, si va fi folosita de mai putine ori pe pagini, dar este si ea relevanta. In cazul nostru fraza secundara poate fi de exemplu : oferta imobiliare Cluj Napoca. !!! Pe paginile de oferta/produse/servicii o sa folositi cuvinte cheie, mai specifice: vanzari apartamente Cluj Napoca, vanzari case Cluj Napoca, vanzari garsoniere Cluj Napoc, etc., si este indicat sa apara si fraza primara pe aceste pagini.

3.2. Optimizarea paginilor pentru cuvinte cheie;

Aici o sa prezentam cum si unde trebuie folosite pe paginile din cadrul site-ului dumneavoastra cuvintele cheie deja determinate.

3.2.1. Factori de cuvinte cheie folositi in algoritmul motoarelor de cautare;

1. Proximitatea cuvintelor cheie. Google se uita la toate cuvintele care alcatuiesc termenul de cautare, si ia in considerare ordinea lor, si distanta intre ele. De exemplu daca cineva cauta dupa fraza: “apartamente din Cluj Napoca”, atunci pagina optimizata dupa fraza “apartamente  Cluj Napoca” va fi considerata mai relevanta, decat cea optimizata dupa “Cluj Napoca , apartamente”, sau “apartamente si garsoniere din Cluj Napoca”;

2. “Inaltimea” cuvintelor cheie. Aceasta inseamna ca motorul de cautare, se uita, cat de sus/jos in pagina apar aceste keyworduri. Cu cat mai sus, cu atat mai bine. Cazul ideal este, daca apar cuvinte in primul head-ing, sau primul paragraph;

3. Densitatea cuvintelor cheie. In engleza se mai numeste “keyword weight”. Aceasta inseamna cat de des sunt folosite cuvintele cheie pe pagina, sau numarul aparitiei cuvintelor cheie, raportat la numarul total de cuvinte. Nu exista un anumit procentaj ideal pentru Google; Incercati sa le folositi cat se poate de mult, dar fara sa fortati acest lucru. Google va considera spam, si va fi jenant pentru vizitatorii dumneavoastra;

4. Plasarea cuvintelor cheie. Google se uita dupa cuvinte cheie in titlul paginii, in heading-uri (<H1></H1>, etc.), in linkuri, in proprietatea ALT a imaginilor, in elementele combobox-urilor, si in text-ul din BODY. Despre plasarea cuvintelor cheie, vom vorbi mai detaliat putin mai incolo;

5. Formatarea cuvintelor cheie. Nu este un factor foarte important, dar trebuie luat in calcul. Incercati sa diferentiati cuvintele cheie de pe pagina, de celelalte cuvinte (prin bold/italic sau alte metode);

3.2.2. Cum si unde se folosesc cuvintele cheie;

Trebuie precizat faptul ca Google nu este case-sensitive, adica: VANZARI IMOBILIARE, vanzari imobiliare, sau Vanzari Imobiliare, pentru motorul de cautare sunt echivalente. La fel, cuvintele legate sunt considerate 2 cuvinte separate, adica: vanzari-imobiliare, vanzari_imobiliare, vanzari/imobiliare, si vanzari imobiliare sunt  echivalente. In continuare vom arata, unde este indicat sa apara cuvintele cheie din pagina dumneavoastra.

1. Titlul paginii – este cel mai important loc, unde cuvintele cheie trebuie sa apara. Fiti siguri, ca titlul fiecarei pagini, contine cuvintele cheie, cele mai relevante pentru aceea pagina;

Sfaturi importante legate de titlul paginii:

–          nu uitati ca titlul paginii o sa fie afisat de browser, si ceea ce este si mai important, acest titlu va fi afisat in motoarele de cautare. Astfel trebuie sa creati titluri de pagini, care nu numai ca sunt bogate in cuvinte cheie, dar la fel sunt atractive pentru vizitatorii dumneavoastra;

–          fieacare pagina trebuie sa aiba un titlu unic. Nu repetati acelasi titlu pentru mai multe pagini;

–          daca este posibil includeti fraza primara in titlul fiecarei pagini;

–          incepeti titlul paginii cu fraza primara, si continuati cu cele mai bune fraza secundare;

–          nu repetati mai mult de 2 ori, cuvintele cheie in titlu;

–          folositi numai cuvintele cheie in titlu, si evitati folosirea numelui sau sloganului firmei. Daca doriti neaparat sa le includeti, puneti-le la sfarsit;

–          din tag-ul <HEAD>, sa fie <TITLE> pe primul loc;

2. Tagul META “Description”. Nu are impact major asupra optimizarii, dar totusi prezinta o oarecare importanta. Motorul de cautare ia in considerare primele 160 de caractere (sau aproximativ primele 20 de cuvinte) din acest tag. Cand Google afiseaza rezultatele cautarii, pentru fiecare rezultat afiseaza (cu litere mai mari) titlul paginii, iar sub el, acele 20 de cuvinte din tag-ul “Description”. Din acest motiv, tagul trebuie sa aiba un continut atractiv pentru vizitatori. Daca acest tag nu este specificat, atunci Google se uita dupa o descriere a site-ului pe DMOZ (director web, despre care vorbim mai tarziu), iar daca nici aici nu gaeseste nimic, ia bucati semi-aleatoare din continutul paginii;

3. Textul linkurilor. Cazul ideal este sa folositi linkuri text:

<A HREF=”cuvinte_cheie.html”>cuvinte_cheie_aici</A>

Daca doriti sa folositi imagini ca linkuri, folositi urmatoarea structura:

<A HREF=”cuvinte_cheie.html”>

<IMG SRC=”cuvinte_cheie.jpg” TITLE=”…”

ALT=”cuvinte_cheie_aici” />

</A>

4. Heading-uri.

<H1>cuvinte_cheie_aici</H1>…

<H5>cuvinte_cheie_aici</H5>

5. Primul si ultimul paragraf din <BODY>.

In cazul ideal in primele, si ultimele 20 de caractere.

<BODY><P>cuvinte_cheie_aici</P>…

si/sau

…<P>cuvinte_cheie_aici</P></BODY>

6. In textul de la comboboxuri.

<SELECT><OPTION>cuvinte_cheie_aici</OPTION></SELECT>

7. URL-ul site-ului. Incercati sa aveti un domeniu care sa cuprinda in textul sau cuvintele cheie: www.cuvinte-cheie-aici.ro;

8. Nume de fisiere si directoare. Folositi cuvintele cheie in numele directoarelor si fisierelor. Un exemplu relevant este urmatorul: cuvinte_cheie/cuvinte_cheie.html

9. In atributul “ALT” a imaginilor.

<IMG SRC=”…” ALT=”cuvinte_cheie_aici” />

3.3. Structurarea paginilor;

In  cazul ideal, pagina dumneavoastra ar trebui sa aiba o singura tema principala. Daca firma dumneavoastra de exemplu in afara de vanzari de imobiliare, se mai ocupa si cu inchirieri de masini, este indicat, si necesar sa despartiti aceste 2 teme, pe 2 site-uri diferite. In momentul de fata, Google-ul considera fiecare subdomeniu din cadrul site-ului dumneavoastra ca si un domeniu independent. Asa ca, daca nu cumparati 2 domenii, pentru cele 2 site-uri (vanzari imobiliare si inchiriere masini), trebuie sa faceti macar 2 subdomenii diferite pentru ele.

Vom lucra si in continuare, cu exemplul anterior, si anume: vanzari de imobiliare. In cadrul site-ului veti avea probabil diferite pagini pentru:

– vanzari apartamente, optimizat pentru cuvintele cheie: vanzari apartamente Cluj Napoca;

– vanzari garsoniere, optimizat pentru cuvintele cheie: vanzari garosniere Cluj Napoca;

– etc.;

Este indicat, ca toate linkurile de pe paginile despre vanzari apartamente, sa arate numai catre alte pagini despre vanzari apartamente, la fel toate paginile despre vanzari garsoniere sa arate numai catre alte pagini despre vanzari garosniere, si un link catre pagina principala, de pe fiecare pagina. Incercati sa impartiti site-ul dumneavoastra in cat mai multe pagini se poate. Este mult mai bine, sa aveti 50 de pagini scurte, la subiect, decat sa aveti 5 pagini foarte lungi. Totusi sa aveti numai pagini cu informatii relevante, cu minim 200 de cuvinte.

Daca aveti javascripturi sau stiluri folosite pe pagini, ar fi indicat sa le puneti in fisiere separate (.js, .css), si sa fie impartite. Astfel motorul de cautare va avea de parsat un cod mult mai clar. Un aspect sensibil se remarca la nivelul siteurilor cu continut flash, si frame-uri. Nu uitati, ca motoarele de cautare se uita in sursa paginii HTML, ele nu pot analiza animatii, sau imagini. Pentru motoarele de cautare design-ul paginii dumneavoastra nu este deloc important, de aceea va sfatuim sa nu puneti mare accent pe design, ci pe continut. Noi stim insa, ca design-ul vinde produsul de multe ori. Asa ca trebuie sa incercati sa gasiti calea de mijloc: un design placut si atractiv, un cod cat se poate de clar, fisiere javascript, si stylesheet-uri in fisiere separate. Este foarte important, ca vizitatorii dumneavoastra sa nu trebuiasca sa astepte secunde lungi, pana site-ul dumneavoastra se incarca. Sfaturi pentru o incarcare mai rapida a paginii gasiti aici: https://ptamas.wordpress.com/

Google si URL-uri dinamice;

Ce inseamna un URL dinamic? Un exemplu ar fi urmatorul: http://www.domain.ro/index.php?thread=10&id=3&sid=98971298178906&lan=ro. Prezenta caracterului “?” arata, ca este vorba despre un URL dinamic. Pentru Google nu este o problema indexarea paginilor cu URL dinamic. In blogul oficial pentru webmasteri, cei de la Google ne incurajeaza sa lasam aceste URL-uri dinamice, iar motorul de cautare va analiza acesti parametri, si va face o indexare corecta. Acest URL insa nu este un URL prietenos pentru vizitatori, si la fel nu contine nici un cuvant cheie. De aceea, de obicei URL-uri de acest gen se rescriu prin tehnica mod rewrite intr-un URL care pare sa fie static. Statisticile arata ca acele pagini care au schimbat URL-urile dinamice in URL-uri statice, au urcat cateva pozitii pe Google. Pentru a intelege in totalitate ceea ce urmeaza, este indicat sa va familiarizati cu termenul de mod rewrite.

Sa analizam parametrii din URL:

1. thread=10, sa zicem, ca aceasta inseamna ca este vorba despre modulul de stiri;

2., este vorba despre stirea cu id-ul “3” din baza de date;
3. sid=98971298178906, id-ul de sesiune al vizitatorului;

4. lan=ro, limba folosita va fi: romana;

Parametri 1, 2 si 4 sunt neaparat necesari pentru a defini aceasta pagina, insa parametrul 3, nu are legatura cu continutul paginii. Fiind un id unic pentru fiecare vizitator, acesta se va schimba de fiecare data cand cineva acceseaza pagina. Sfatul nostru este sa transformati URL-urile dinamice in URL-uri statice, si pe cat posibil sa includeti cuvinte cheie in URL, lasand numai parametrii importanti in acest URL rescris.

O rescriere corecta pentru url-ul:

http://www.domain.ro/index.php?thread=10&id=3&sid=98971298178906&lan=ro

ar putea fi

http://www.domain.ro/stiri/ro/a+aparut+noua+versiune+google+chrome

URL-ul rescris arata mult mai prietenos pentru vizitatori. Pe langa acest fapt, apar cuvinte cheie in URL (factor on-page), adica pentru aceasta primim un punct rosu de la Google. Mentionam aici, ca nu este un factor decisiv, dar fiecare mic aspect conteaza. Pentru Yahoo, prezenta cuvintelor cheie un URL pare sa fie un factor foarte important.
Mentionam aici inca o data, ca Google indexeaza paginile cu URL dinamic, insa fiecare motor de cautare prefera URL-uri statice.
Rescrierea URL-urilor poate fi o munca grea, si sofisticata, dar care poate sa merite. Acest rewrite poate si trebuie facut de webmasteri experientati.

Google sitemaps;

Problema majora pentru care protocolul Sitemap a fost introdus de Google, in 2005, era ca multe site-uri au devenit prea largi, prea complexe, si isi schimbau continutul prea des, iar motorul de cautare nu putea tine pasul. Google indexeaza si reanalizeaza miliarde de pagini in fiecare zi, astfel incat este posibil ca o modificare efectuata pe site-ul dumneavoastra sa fie detectata de Google numai in saptamani, sau chiar luni. Sitemap-urile ajuta motorul de cautare pentru o indexare mai rapida a tuturor paginilor. Pe langa aceasta, aceste sitemap-uri vor specifica care sunt acele pagini care schimba continutul mai des (si cat de des), si care au o prioritate mai mare pentru crawlerul ce le analizeaza.

Un sitemap este de obicei un fisier XML, un fel de harta a site-ului, care contine adresa paginilor din cadrul site-ului. Folosirea unui sitemap nu inseamna ca Google nu va continua sa verifice si sa urmareasca linkurile din cadrul site-ului si sa indexeze pagini noi, sau sa reviziteze pe cele indexate deja. La fel paginile incluse in sitemap nu vor avea o importanta mai mare, eventual vor fi revizitatea mai des (daca au continut care se schimba des).

Un site de prezentare bine structurat si format din cateva pagini cu continut static, nu are nevoie de sitemap. Motorul de cautare va putea gasi si indexa toate paginile din cadrul site-ului. Structurarea corecta inseamna ca un vizitator poate sa ajunga la orice pagina, de pe orice alta pagina (nu neaparat direct) folosind linkurile si nu mai mult de 2-3 click-uri. In cazul forum-urilor, unde structura se schimba des (apar topic-uri noi, pagini noi), sau in cazul blog-urilor, unde iar se schimba continutul, folosirea sitemap-urilor este indicata. Acest sitemap se va schimba in timp, prin aparitia noilor pagini, si trebuie retrimis la Google. Aceasta se poate face manual, dar la fel se poate automatiza procesul, printr-un script server side (cod PHP, ASP, etc.) care va trimite un request catre Google, aceasta indicand faptul ca harta site-ului a fost schimbata, si dorim sa fie reanalizata. Pe langa submit-area automata a sitemap-ului catre Google, se poate crea un Cron Job care va crea acest sitemap si va trimite catre motorul de cautare cu o frecventa de timp care alageti dumneavoastra.
Pentru crearea si/sau trimiterea automata a sitemap-ului este indicat sa se ocupe un webmaster experimentat. Pentru mai multe informatii despre sitemap-uri accesati pagina: http://www.sitemaps.org/ro/, unde veti afla cum trebuie sa arate acest sitemap.

3.4. Conectarea corecta a paginilor;

In acest subcapitol vom studia 2 metode de structurare a linkurilor interne, si vom da cateva sfaturi pentru conectarea corecta a paginilor din cadrul site-ului.

–          Structura “ierarhica”. Structura ierarhica inseamna ca anumite pagini din cadrul site-ului sunt considerate mai importante (de obicei pagina principala de exemplu). De pe fiecare pagina va exista un link catre paginile importante, dar nu fiecare pagina va contine link-uri catre toate celalalte pagini. Aceasta inseamna ca PageRank-ul va fi concentrat pe paginile importante. Aceasta structura este structura ideala pentru SEO, pentru ca pagina principala va fi pagina cea mai importanta. Aceasta presupune ca trebuie sa-i acordati importanta in ceea ce priveste optimizarea ei pentru cuvintele cheie principale. Conceptul acestui tip de structura este prezentat in figura urmatoare:

Structura ierarchica

–          Structura “plasa”. Structura plasa inseamna ca fiecare pagina are aceeasi importanta. Este cea mai simpla metoda de strcuturare, in care fiecare pagina are un link catre toate celalalte pagini. Multi web designeri folosesc pe site-uri aceasta structura, fara sa fie constienti de efectele produse. Prin aceasta structura toate paginila vor avea aceeasi importanta, ceea ce nu este cazul ideal. Conceptul acestui tip de structurare este prezentat pe figura urmatoare:

Structura plasa (mesh)

Cateva sfaturi pentru crearea linkurilor interne;

– Folositi linkuri bazate pe text, si folositi cuvinte cheie in text-ul linkurilor. Nu folositi link-uri cu textul: “Home page”, “click aici”, sau cuvinte irelevante. In aceste linkuri trebuie sa apara cuvintele cheie din pagina destinatie a linkului;

– Creati linkuri de pe pagina principala, sau pagina de sitemap, catre toate celalalte pagini. Daca numarul paginilor nu este mare, puteti folosi pagina principala ca pagina harta;

– O pagina de tip harta este foarte importanta (fie aceasta pagina principala sau o alta pagina), pentru ca ajuta vizitatorii sa gaseasca mai repede ce vor, si la fel crawler-ul va gasi toate paginile mai repede. Este indicat ca aceasta pagina de tip harta, sa aiba continut si in afara de linkuri;
– Paginile mai putin relevante sa aiba linkuri numai catre pagina principal;

– Numai paginile care au in continut aceleasi cuvinte cheie sa fie conectate intre ele prin linkuri;

– Folositi adresa absoluta cand creati un link catre pagina principala:
http://www.domain.ro/index.html in loc de index.html.

Cum functioneaza motoarele de cautare – Optimizare Google

Ianuarie 18, 2010 2 comentarii

2. Cum functioneaza motoarele de cautare

Motorul de cautare Google, foloseste algoritmi sofisticati, si ia in calcul mai mult de 100 de criteria. Fiecarei pagini web ii este asociat un “rank”, adica o anumita pozitie. Acest algoritm de obicei se schimba in timp, astfel optmizarea unui site, nu este o munca care trebuie facuta odata. Cand Google decide pozitia pe care va afisat(listat) un site, el ia in considerare 2 factori principali:

2.1. Factori on-page (keyword);

Acest factor depinde de modul si de pozitia cuvintelor cheie dintr-un anumit site, de cuvintele cheie utilizate, altfel spus, cat de bine este optimizat site-ul pentru anumite cuvinte cheie. Majoritatea oamenilor scriu intre 2–5 cuvinte cand cauta ceva pe Google, iar motorul de cautare se uita in baza lui de date dupa site-uri a caror tema (dictata de cuvintele cheie), seamana cel mai mult cu termenul cautat. Acesti factori on-page determina relevanta paginii dumneavoastra;

2.2. Factori off-page (link);

Acest factor inseamna cantitatea, si calitatea link-urilor de pe alta pagini catre pagina dumneavoastra. De fapt, acest factor determina Page Rank-ul, adica importanta unei pagini. Un link de pe o pagina “A” catre pagina “B” este un fel de “vot” pentru importanta paginii “B”.  Despre cantitatea si calitatea acestor link-uri vom discuta mai tarziu;