descarregar PDF

2.1. Aprendre llegint

Què és una URL?

Una URL (Uniform Resource Locator, en anglès) és l'adreça que indica la localització d'un document o d'altres recursos a Internet i que permet accedir-hi, de la mateixa manera que una adreça postal ens diu el lloc on algú resideix.

Les adreces web o URL tenen una estructura característica que les identifica i que es podria resumir així: protocol://màquina/directori/arxiu. Contenen, així doncs, dues parts fonamentals que indiquen on volem anar i de quina manera podem arribar-hi.

 

Exemple d'adreça web o URL

Protocols

Les URL estan encapçalades per les sigles http, dos punts i dues barres (http://) que signifiquen Protocol de Transferència d'Hipertext i que defineixen la sintaxi amb què les màquines (servidors i clients) es comuniquen per enviar pàgines web.

Aquesta sintaxi canvia en funció del que vulguem fer. Si volem comunicar-nos amb un servidor segur per fer, per exemple, una transacció de comerç electrònic, el protocol serà https://. La essa indica que s'està utilitzant el protocol de seguretat Secure Socket Layer (SSL). Es pot reconèixer pel cadenat que apareix a la base de la finestra del navegador.

 

Cadenat SSL

 

De la mateixa manera, si volem enviar un arxiu a una pàgina o bé copiar dades d'un ordinador a un altre, utilitzarem el protocol FTP o protocol de transferència de fitxers.

Finalment, si volem enllaçar una adreça de correu electrònic perquè se'ns obri el client de correu i puguem enviar un missatge, utilitzarem el protocol mailto:

Adreces IP i DNS

Darrere del protocol, i separada per dos punts i dues barres, la URL mostra la màquina en què està ubicada una pàgina web, amb les famoses tres w al davant per indicar que forma part de la World Wide Web.

Les màquines on s'allotgen les pàgines s'identifiquen amb noms i extensions que ens resulten ja tan familiars com les dades d'un carrer. Per exemple, www.google.com.

En realitat, però, les màquines no entenen aquests noms i el que llegeixen és una sèrie de nombres. És el que s'anomena una adreça IP (Protocol d'Internet). Està formada per quatre segments de nombres separats per punts que van del 0 al 255, i es podria comparar a un número de telèfon. Així, cada lloc web té el seu número.

Teclejar aquestes IP seria un embolic per als usuaris, ja que no són fàcils de recordar. Per això, per fer la traducció del format numèric al dels noms, es va inventar el DNS o Servidor de Noms de Domini, que són equips que contenen una base de dades que associa les sèries de números amb el seu nom corresponent.

Per exemple, 209.85.129.147 correspon al domini www.google.com i 145.97.39.155 a www.wikipedia.org.

Dominis: .com, .net, .cat...

El domini més conegut és sens dubte el .com (puntcom), que ha passat a formar part del llenguatge popular per referir-se a recursos web. És el que s'anomena un domini genèric de primer nivell. Però no és l'únic que hi ha.

Dins de la mateixa categoria que el .com, que designa recursos comercials, també hi ha el domini .org, per referir-se a organitzacions, sovint sense ànim de lucre; el .net, per a recursos d'Internet; el .edu, per identificar recursos educatius, o el .info, per a agències d'informació. Per als recursos en català i sobre la cultura catalana, tenim el domini .cat i per a la Unió Europea, el .eu.

Els dominis de primer nivell estan administrats per un organisme conegut per les seves sigles: ICANN (Corporació d'Internet per l'Assignació de Noms i Nombres).

 

Logo de la ICANN

L'ICANN és també qui assigna els dominis de primer nivell territorials a tots els estats reconeguts per les Nacions Unides. Aquests dominis, a diferència dels genèrics, estan formats només per dues lletres. Així .es es refereix a Espanya, .fr a França, o .pt a Portugal, per citar només els més propers.

Directoris i arxius

Els elements que apareixen darrere del domini, i després d'una barra en una adreça web, indiquen la localització concreta d'un arxiu. Així, per exemple, si volem consultar els butlletins d'informació que la Generalitat de Catalunya publica, anirem a:

http://www.gencat.cat/butlletins

D'aquesta manera, el servidor anirà a buscar la carpeta on es troba la informació concreta sobre aquest tema per tal de servir-nos-la.

 

De la mateixa manera, si volem consultar un document concret d'una carpeta ens podem trobar amb una URL amb l'estructura següent:

http://www.domini.com/carpeta/arxiu.html

 

Les eines de què disposem actualment per publicar continguts a Internet poden canviar el final de les adreces. L'usuari es pot trobar amb pàgines acabades en .html, .htm, .php (llenguatge de programació utilitzat per a la creació de pàgines web dinàmiques), .asp, .js o en tot un reguitzell de nombres i lletres, com en aquest cas:

http://www20.gencat.cat/portal/site/SalaPremsa/menuitem.1dd23e6acb97dfe4f8b
850b8b0c0e1a0/?vgnextoid=51d1047f56ab9010VgnVCM1000000b0c1e0aRCRD&vg
nextchannel=51d1047f56ab9010VgnVCM1000000b0c1e0aRCRD&vgnextfmt=default

 

Sigui com sigui, conèixer aquesta estructura sempre ens servirà per tornar a la pàgina mare d'un lloc web quan hi hagi algun error, com per exemple que un arxiu concret hagi deixat d'existir. Per fer-ho, només haurem d'esborrar tot el que es troba darrere del domini. També hi ha programes (i complements del navegador Firefox) que 'retallen' les URL llargues per transformar-les en adreces més senzilles de recordar. És el que s'anomena URL netes.