miércoles, 17 de enero de 2007

Como usar los META TAGS


Los metadatos


La forma usual de insertar metadatos en el documento es por medio de la etiqueta <META> en la sección <HEAD> de la página.


<HEAD>

<meta content='text/html; charset=UTF-8' http-equiv='Content-Type'/>

</HEAD>

Hoy por hoy, las metaetiquetas o meta tags no sirven de mucho. Debido al abuso que se ha hecho de ellos, cada vez son mas los buscadores que los ignoran.
El standard html define la estructura de una etiqueta META, pero no sus valores. Puedes inventarte tus propias etiquetas META pero dado que no se visualizan en el navegador, y que realmente sólo las usan los buscadores y otras herramientas informáticas que sólo procesan las etiquetas META mas difundidas, tampoco tiene mucho sentido crear tu propia metainformación, salvo para uso propio.

En un blog de Blogger como éste, se recomienda el uso de estas 3 meta etiquetas:

<meta content='text/html; charset=UTF-8' http-equiv='Content-Type'/>
<meta content='true' name='MSSmartTagsPreventParsing'/>
<meta content='blogger' name='generator'/>

Pero podemos encontrar una gran variedad de META TAGS con usos muy diversos, y el uso que se haga de ellos es cosa del responsable de la edición de la página (los hay más y menos lícitos). De momento sólo vamos a explicar las meta etiquetas más conocidas con algún ejemplo para que las aprendais a usar, o si las veis para que las reconozcáis:



Es importante saber que los metatags funcionan declarando propiedades y valores para esas propiedades, por ejemplo la etiqueta "author" se enlaza con el nombre del autor de la página. Además podemos encontrar atributos, como lang.

Lang como atributo:
Se declara que el nombre del autor es francés:

<META name="Author" lang="fr" content="Arnaud Le Hors">

También es aplicable al idioma de los keywords, por ejemplo:

<-- US English -->
<META name="keywords" lang="en-us"
content="vacation, Greece, sunshine">
<-- British English -->
<META name="keywords" lang="en"
content="holiday, Greece, sunshine">
<-- French -->
<META name="keywords" lang="fr"
content="vacances, Gr&egrave;ce, soleil">

PICS Plataforma para selección de contenidos de Internet

Si os encontrais esto, no tiene nada que ver con fotos.
La PICS, Platform for Internet Content Selection, es una infraestructura para asociar las meta tags con contenidos de Internet. Se diseñó para ayudar a los padres y profesores a controlar el acceso de los niños a internet, filtrando la página con arreglo a su contenido, advirtiendo de que puede tener, por ejemplo, contenido sexual, violencia o lenguaje ofensivo aunque también tiene otros usos como privacidad, administrar derechos intelectuales de la página, etc.

Un tag de este tipo se puede hacer de una manera muy sencilla con un generador de PICS, por ejemplo, con el de:

http://vancouver-webpages.com/VWP1.0/VWP1.0.gen.html

Nosotros nos hemos hecho ésta PIC para nuestra web, diciendo que el contenido de Soplando al Cierzo es casi angelical:

<META http-equiv="PICS-Label" content='(PICS-1.1
"http://vancouver-webpages.com/VWP1.0/" l gen true comment "VWP1.0" by "micorreo@este.es"
on "2007.01.17T11:26-0800" for "http://soplandoalcierzo.blogspot.com/"
r (Gam 0 V 0 Env -2 SF 0 Com 0 Can 0 Edu -1 S 0 P 0 Tol -1 MC 0 ))'>

Vamos a ver que sale cuando decimos que somos racistas, anticulturales, con ilimitados contenidos violentos y sexuales, desfavorables al medioambiente, que incluimos palabras feas y compras y apuestas online. Etre tanta profanación, nos encontramos que hay que seleccionar cuanto contenido canadiense tiene nuestra web... no entendemos esta parte:
Category: Canadian Content
· All: All-Canadian content
· Some: Some Canadian content or production
· None: No Canadian content
¿Por qué el contenido canadiense tiene un campo propio, como el sexo y la violencia? Está claro que los maños tendremos que revindicar un campo propio también. Bueno, da igual, hemos puesto All.

He aquí nuestra nueva etiqueta PICS:

<META http-equiv="PICS-Label" content='(PICS-1.1
"http://vancouver-webpages.com/VWP1.0/" l gen true comment "VWP1.0" by "micorreo@este.es"
on "2007.01.17T11:40-0800" for "http://soplandoalcierzo.blogspot.com/"
r (Gam 3 V 5 Env 2 SF 2 Com 3 Can -2 Edu 1 S 7 P 4 Tol 4 MC 2 ))'>

Ya veremos cual de las 2 ponemos... lo mismo ninguna.

Todo esto no es muy fiable ya que las metatags las escribe el autor de la página y como habéis visto uno pone lo que quiere o le interesa de una manera bastante simple.

Descripción de las etiquetas meta más conocidas y sus usos seguidos por un ejemplo:

Keywords
Las Keywords deben ir separadas por comas, y hay que poner primero las palabras más importantes.
Nota: Debido al abuso que se ha hecho de los meta tags, cada vez cada vez son más los buscadores que los ignoran, especialmente el de Keywords. Inktomi es el único motor de búsqueda que los usa para indexar sites y aún así le da muy poca importancia.

<meta name="keywords" content="gratis, didáctica, recursos, artículos, herramientas, tutoriales, gráficos, juegos, download, freeware">


Description
La descripción de la página debe de tener menos de 200 palabras.

<meta name="description" content="Miweb ofrece recursos gratuitos para profesores de secundaria como juegos, gráficos, artículos, noticias, tutoriales y fondos de escritorio">


Author
Aquí se pone el autor de la página.

<meta name="author" content="Perico Pérez">


Content-Language
Indica el idioma del documento.

<meta http-equiv="content-language" content="en-us">

Content-Language con FrontPage: Cuando se modifican las propiedades de una página, FrontPage restablecerá la etiqueta META que contiene la variable de sistema content-language. Esta etiqueta no se conserva después de que realiza modificaciones en el cuadro de diálogo Propiedades de página.


Email
La dirección email de contacto.

<link rev="made" href="perico@punto.com">

Copyright
El año de copyright y el nombre del holder

<meta name="copyright" content="2002 by Miweb">


Revisit
Establece con que frecuencia pasa el spider (programa diseñado para explorar páginas web en forma automática)

<meta name="revisit-after" content="2 weeks">

Refresh
Este campo debe contener la URL a la que nos remite la página transcurridos un número específico de segundos. Se puede usar para refrescar la propia página o para redireccionar a otra diferente, aunque esto no es aconsejable ya que con estas prácticas se deja inaccesible la página para otros usuarios.

Notar que las comillas tienen que incluir los segundos y, en el caso de un redireccionamiento a otra página, también la url en cuestión.

<meta http-equiv="refresh" content="120" />

<meta http-equiv="refresh" content="120; url=http://www.redireccionaestaweb.com">


Expires
Fecha de expiración. Indica la vigencia del documento y sirve para que el navegador no guarde una página en caché indefinidamente y se vea forzado a cargar las nuevas versiones.
La fecha debe estar necesariamente en formato RFC840 (GMT):

dia_de_Semana, DD-Mon-YY HH:MM:SS TIMEZONE(Greenwich)

Por ejemplo: Fri, 06 Aug 2008 06:25:55 GMT
Las abreviaturas de los días de la semana y los meses en inglés bajo esta notación son:

dia_de_Semana = "Mon" | "Tue" | "Wed" | "Thu" | "Fri" | "Sat" | "Sun"

Mon = "Jan" | "Feb" | "Mar" | "Apr" | "May" | "Jun" | "Jul" | "Aug" | "Sep" | "Oct" | "Nov" | "Dec"


Si la fecha está expresada en un formato distinto, el valor de expires será interpretado como now, es decir, se fija una caducidad inmediata.

<meta http-equiv="expires" content="Wed, 30 Jan 2007 21:29:02 GMT">


Distribution
Global – major entry points
Local – local entry points

<meta name="distribution" content="global">


Robot
Para restringir el acceso de los robots a la web se usan los siguientes meta tag:

All – Los robots pueden indexar y seguir los links de la página.
Index – la página debe ser indexada
No Index – la página no debe ser indexada
Follow – pide al robot que siga los links que existan en la página e indexe las páginas resultantes
No Follow – los Robots pueden indexar la página pero no seguir los links.
None – Los robots no pueden indexar ni seguir los links.
Los valores por defecto se entiende que son index, follow (separados por coma).

<meta name="robots" content="nofollow">
< meta name="robots" content="noindex,follow">

Esto mismo se consigue también con el archivo robots.txt;
Esto lo explica muy bien los de ignside en su página: //www.ignside.net/man/servidores/robots.php
“Cuando un robot visita una página, por ejemplo http://www.ignside.net/, lo primero que solicita al servidor es el archivo Cuando un robot visita una página, por ejemplo http://www.ignside.net/, lo primero que solicita al servidor es el archivo http://www.ignside.net/robots.txt...” bla bla bla


Rating

Indica a que público está destinado la web.
General: para todo el mundo
14 Years: para mayores de 14 años
Mature: para adultos
Restricted: acceso restringido

<meta name="rating" content="14 years">


Character set - content-type
Con el content-type indicamos al navegador el tipo de documento que es nuestra página: si es un documento html, o un documento de texto plano.
También el set de caracteres que usamos, set character. El más común es el ISO-8859-1 La siguiente lista explica otras de las series de lenguajes que contiene el ISO 8859 y que os podréis encontrar:

ISO-8859-1 – Western Europe and Americas: Afrikaans, Basque, Catalan, Danish, Dutch, English, Faeroese, Finnish, French, Galician, German, Icelandic, Irish, Italian, Norwegian, Portuguese, Spanish and Swedish

ISO-8859-2 – Latin-written Slavic and Central European languages

ISO-8859-3 – Esperanto, Galician, Maltese, and Turkish

ISO-8859-4 – Scandinavia/Baltic

ISO-8859-5 – Cyrillic

ISO-8859-6 – Arabic

ISO-8859-7 – Modern Greek

ISO-8859-8 – Hebrew

ISO-8859-9 – Western Europe and Americas: Afrikaans, Basque, Catalan, Danish, Dutch, English, Faeroese, Finnish, French, Galician, German, Turkish, Irish, Italian, Norwegian, Portuguese, Spanish and Swedish

<meta http-equiv="content-type" content="text/html;charset=iso-8859-1">


Pragma
Para evitar que una página se guarde en cache se ordena al navegador que no almacene una copia cache de la página. Es aconsejable su uso en páginas dinámicas cuyo contenido cambia frecuentemente. Su único valor aceptable es no-cache.

<meta http-equiv="pragma" content="no-cache">

Nota: cuando se utiliza esta metaetiqueta es posible que la página web siga almacenada en caché en la carpeta Archivos temporales de Internet.
Las páginas que explora Internet Explorer no se guardan en caché mientras no se haya llenado la mitad del búfer de 64 KB. Normalmente, las metaetiquetas se insertan en la sección de encabezado de los documentos HTML, que aparece al comienzo del documento. Cuando se analiza el código HTML, se lee de arriba abajo. Al leer la metaetiqueta <HTTP-EQUIV="PRAGMA" CONTENT="NO-CACHE">, Internet Explorer busca la existencia de la página en la caché justo en ese momento y si está, la elimina.
Para impedir de manera adecuada que la página Web aparezca en la caché, se recomiendan por ejemplo:

<HTML>

<HEAD>
<META HTTP-EQUIV="REFRESH" CONTENT="5">
<TITLE> Pragma No-cache </TITLE>
</HEAD>

<BODY>


Generator
Indica el programa que se ha usado para editar la página.

<meta name="generator" content="Metty Online Version 1.0">

<meta name="generator" content="HTML-Kit" />

etc...


Window Target
Indica el nombre de la frame donde la página tiene que ser cargada.

<meta http-equiv="window-target" content="_top">


Set-cookie
Mediante esta metatag podemos enviar una cookie al navegador del usuario. Si contiene fecha de expiración, el navegador la conservará en el disco duro hasta dicha fecha; en caso contrario, se borrará al terminar la sesión de navegación.

<META HTTP-EQUIV="Set-Cookie"
CONTENT="nombre_cookie=valor_cookie;expires=fecha_valor;
path=/" />

Abstract
Resume el description meta tag con unas 100 palabras.

<meta name="abstract" content="Viewpoints, Tools, and Content for Webmasters">

Anti smart-tags
Las smart-tags fueron un “invento” de microsoft que permitía alterar el contenido de una página web, insertando enlaces aqui y allá. El problema es que el autor de la página no decide donde incluye links ni hacia donde los enlaza sino la propia microsoft. Por supuesto se levantó un clamor contra la idea, que de momento está aparcada.

<meta name="MSSmartTagsPreventParsing" content="TRUE">

Content-Script-Type
indica el tipo de lenguaje script utilizado y del uso de CSS respectivamente:

<META HTTP-EQUIV="Content-Script-Type" CONTENT="text/javascript">

<META HTTP-EQUIV="Content-Style-Type" CONTENT="text/css">




Comentarios
Aunque los comentarios no son metadatos, algunos morores de búsqueda los usan en vez de usar los metatags.

<!--Created for root directory index page 8/6/02-->

The Dublin Core
No queremos dejar de mencionar esta iniciativa de standards y prácticas, útil para etiquetar bibliografías y documentación electrónica.
[DCORE] website: http://purl.org/dc




para saber más sobre este tema puedes usar este LINK del World Wide Web Consortium, pero avisamos, está en inglés:

http://www.w3.org/TR/REC-html40/struct/global.html#edef-META


Esperamos que os haya ayudado esta información.

2 comentarios:

Anónimo dijo...

hola! muy buena informacion! muchas gracias...

Anónimo dijo...

Lo que yo me pregunto es cómo se usan los tags en el caso de, por ejemplo, una web que contenga varios relatos online de unas cuantas páginas y distinto tema cada uno. ¿Se repetirían la descripción y las palabras clave en todas las páginas? ¿Variarían en función del asunto tratado en cada argumento?