La forma más sencilla de identificar a un comunicante en Internet es controlar la dirección IP que aparece en la cabecera de la petición HTTP que se envía al servidor para solicitar la descarga de una página. Al pie de este artículo podrá ver su IP tal como la recibimos en la Flecha.
Inicialmente existía una correspondencia
ordenador IP, de forma que este criterio se ha usado para
controlar aspectos relacionados con la identidad del visitante. Por
ejemplo en encuestas, no suelen dejar votar más de una vez a una
IP, en estadísticas sobre los visitantes de una página web, la IP
determina si las visitas es de un visitante ocasional o habitual, y
si un mismo visitante repite visita. Por ejemplo la IP controla la
rotación de baners de forma que en cada visita se enseñe uno
diferente y otras muchas actividades relacionadas con la web.
Faltan direcciones IP
El problema es que en la actualidad la relación unívoca ordenador - dirección IP no es válida. Faltan de direcciones IP, el sistema actual IPv4, (IP versión 4), o el uso de cuatro cifras menores de 256 para definir una dirección IP, permite crear hasta 4.857.532.416 direcciones diferentes. Cuando se implantó el sistema nadie pensó que alguna vez fueran escasas, pero actualmente no hay suficientes direcciones libres y esta situación se irá agravando hasta que se implante la norma IPv6, (IP versión 6), que permitirá 33.855.057.900.000 direcciones diferentes, que hoy como en su día con IPv4, nos parecen más que suficientes.
Control de visitantes
Por inercia, muchos sistemas de control de tráfico siguen utilizando únicamente la IP para decidir si una visita es "única" o "raw": es decir, si se trata de un cliente que nos visita por primera vez en el día , o es un "click" repetido porque está entrando de nuevo a un link que ya visitó, o recarga la página, o retrocede en el navegador. Al utilizarse direcciones dinámicas un proveedor de Internet da el mismo IP a múltiples usuarios consecutivos, además el problema aumenta con la multiplicación de redes de PCs privadas, un router, WIFI o no, de una red doméstica da la misma IP a todos los ordenadores de la casa, lo mimo pasa con redes mas amplias como las de una empresa, el proxy de la red da todos los ordenadores de la red, pueden estar utilizando Internet simultáneamente con una única IP. Todo ello aumenta las posibilidades de error en webs muy populares, como periódicos, buscadores, etc., por ello utilizar este sistema hoy en día no es válido para lugares de ese tipo y empieza a ser poco fiable, incluso en páginas menos visitadas.
Las cookies, solución a medias
Las cookies solucionan en parte el problema pues al residir en el ordenador del visitante permiten identificarles de forma independiente de su IP. Sin embargo, hay quien no las admite y en cualquier caso, al residir en el PC del usuario, pueden ser manipuladas o borradas por el dueño del PC. Cada día aumenta el número de usuarios que por motivos de privacidad, pasan de forma automática programas que borran estos y otros rastros de su paso por Internet. Hoy en día son aun útiles en un 90 % de los casos, pero la proporción tiende a descender poco a poco.
La huella del PC, solución efectiva
La solución más efectiva, aun poco utilizada, es identificar la huella del ordenador, es decir el conjunto de toda la información que podemos obtener del ordenador que nos vista, la IP, el nombre de la sesión, la resolución de la pantalla, la profundidad de color, la versión del sistema operativo y del navegador, los plugins instalados, flash, quicktime, etc., ciertos números de matrícula de programas y tarjetas accesibles desde el servidor, las cookies etc., incluso el desfase de la hora del ordenador. Este conjunto de datos permiten fácilmente diferenciar equipos que llega con la misma IP, y más aún con los métodos estadísticos apropiados, identificar a un usuario que repite visita con tanta seguridad como con las cookies, aunque haya cambiado algún identificador desde la última visita, con la ventaja que en este caso la información que permite su identificación reside plenamente en nuestro servido, sin que pueda ser modificada o borrada por el usuario..
El conjunto de datos forman lo ha dado en llamarse la huella del equipo y a semejanza de las huellas dactilares, (no las llamo digitales para no confundir aún más), basta con la coincidencia de alto porcentaje de datos para que las estadísticas bayesianas permiten asegurar, con un mínimo margen de error, si el ordenador que nos visita repite visita o es su primera visita.

considero que al revisar todos esos datos se estaria violando la privacidad del visitante aparte de ralentizar aun mas la carga de las paginas no estoy de acuerdo con tal mecanismo basta de espias a los usuarios
Privacidad? No se accede al ordenador y se coge lo q queremos. El navegador es el que envía o pide los datos q se necesitan para obtener esa huella del PC.
Espías... No parece q estés muy puesto en programación web para decir esas cosas... Si entendieras bien el tema sabrías q no se trata de espiar sino de identificar únicamente el PC q ha accedido a X sitio. Algo necesario para contadores de visitas, contadores para clickeos de banners, etc.
De esta forma si un usuario contrata publicidad y tiene q pagar x visitas o x clickeos se asegura q el dueño no pueda lucrarse malintencionadamente.
Obtener esa información se considera necesario y en ningún caso se viola la privacidad ni los datos serán publicados. Sólo se utilizarán para realizar estadísticas sin q nadie llegue a saber jamás el contenido.
En efecto el sistema solo accede a la información que envia el avegador o que expresamente se permite acceder como las cookies, por tanto puede considerars desde un punto legal "un medio no espia".
Pero considerar que "sólo se utilizarán para realizar estadísticas sin q nadie llegue a saber jamás el contenido", es ser muy optimista. Una vez recaudados los datos cada cual los utilizará para lo que considere conveniente y no necesariamente todos los usos serán a efectos estadísticos.
la info, trata de aclarar como se hace el conteo de visitas, claridad en votaciones y/o encuestas, etc.
pero, ¿como lo hago?, si por ejemplo, tengo como sevidor mi PC, alojando un pagina, ¿como puedo saber todos estos datos de mis posibles visitantes?
Guarda absolutamente toda la informacion que te llega con el navegador, IP, nombre de la sesión, version de sistema operativo, version de navegador, definicion de la pantalla etc etc.
Lee todo lo que es legal que leas en el consultante, sus cookies, plugins instalados, número de matricula de programas etc, Calcula con esa informacion el valor máximo obtenido de ponderar cada código con un numero que da la probabilidad de que el dato no varie entre dos visitas consecutivas de la misma persona, por ejemplo, el IP, nombre de sesión y sistema operativo, varian poco, diremos que coiniciden en el 95% de los casos, damos inicialmente un valor 0,95 a la coinciencia, las cookies es normal que aparezcan nuevas o que las borren, las coincidencias las valoramos como 0,30.
Compara la visita llegada con las que tienen en un archivo. Si los datos coinciden con los de alguien que te ha que te han visitado anteriormente en un 80% del valor ponderado máximo posible, da por bueno que es el mismo visitante, si no coincide con nadie consideralo nuevo.
Si coincide con varios sube el umbral de de coincidencia hasta el mínimo valor necesario para que quede solo uno, Si coincide con uno o no ha encntrado nadie baja el umbral una milesima para la próxima vez.
Si el visitante es viejo, guarda la nueva huella y la anterior la guardas para estudios de estadísticas de ponderacion de datos. Si es nuevo darlo de alta en el fichero
Periodicamente a partir de las estadisticas aumenta o disminuye la ponderacion de los distintos tipos en funcion de lo estables o variables que muestren ser los distintos datos en visitas sucesivas, teniendo en cuenta el tiempo transcurrido entre ellas, y afinas poco a poco y mejoras las poderaciones iniciales.
Venden aplicaciones que esto y mas lo hacen automáticamente.
Tengo un problema con la IP de mi ordenador. Está conectado a la red a través de un router y cuando leo las estadísticas tipo las de motigo, donde generalmente figuran los nombres de los servidores generales del país o ciudad, en mi caso aparece el número de IP público. ¿Esto es normal? o ¿será que está mal instalado el router?
Tengo una duda, si el servidor no obtiene toda esa información por medio de cookies(matricula de programas, numero tarjeta de red, resolución de pantalla, etc...), como las obtiene.
gracias