Search engines and I2P/es

Aus i2pwiki.mk16.de
Zur Navigation springen Zur Suche springen

<languages />

Introducción[Bearbeiten]

Ya que la red I2P es anónima y P2P, es un problema para los nuevos usuario encontrar eepsites de interés y descubrir eepsites nuevas.

En abril del 2016, la mayoría de los motores de búsquedas hospedados en i2p (por voluntarios) no funcionan.

El propósito de este artículo es informar a los voluntarios, para ayudarles a llevar un motor de búsqueda, y si es posible descentralizado.

Tecnologías para los motores de búsqueda[Bearbeiten]

Centralizado[Bearbeiten]

Descripción[Bearbeiten]

Los motores de búsqueda centralizados, como google o bing, se ejecutan en centros de datos. Primero usan spiders (o robots) para inspeccionar la red, siguiendo todos los enlaces de página a página. Las páginas descubiertas a través de este proceso son indexadas en una base de datos almacenada en un centro de datos.

Cuando un usuario hace una búsqueda, la petición es enviada al centro de datos, y un algoritmo procesa el índice y devuelve los resultados. Además, un registro de esa búsqueda es guardado en el centro de datos.

Los mayores problemas con los motores de búsqueda centralizados incluyen: puede fallar y pueden ser bloqueados fácilmente; sus algoritmos devuelven búsquedas 'personalizadas', enfocadas en la venta y comercialización; y están sujetas a las peticiones y vigilancia de los gobiernos.

Uso[Bearbeiten]

Los siguientes motores de búsqueda de la clearnet pueden adaptarse a la red I2P.

Descentralizado[Bearbeiten]

Descripción[Bearbeiten]

De la wikipedia (2015):"Un motor de búsqueda descentralizado es un motor de búsqueda donde no hay un servidor central. Al contrario que los motores centralizados, el trabajo de rebuscar, obtención de datos, indexado y el proceso de peticiones están distribuidos a través de varios pares de una forma descentralizada donde no hay un punto único de control."<ref>https://en.wikipedia.org/wiki/Distributed_search_engine</ref>

Uso[Bearbeiten]

La mayoría de los motores de búsqueda descentralizados requieren de alguna aplicación en la computadora del usuario. Aunque algunos pueden usarse a través de un interfaz HTTP sin que los usuarios tengan que instalarlo, simplemente no contribuirán al indexado.

Cómo hospedar/ejecutar un motor de búsqueda centralizado dentro de I2P[Bearbeiten]

OpenSearchServer[Bearbeiten]

Escrito mayormente en Java. En el 2016 un usuario pudo ejecutarlo dentro de I2P.

El motor de búsqueda http://seeker.i2p usa OpenSearchServer.

Tienes que tener Java 7 (o más nuevo) en tu servidor
Descarga la última versión:

Manual: ¡escribidme!

Apache Nutch<ref>https://en.wikipedia.org/wiki/Apache_Nutch</ref>[Bearbeiten]

El motor de búsqueda http://epsilon.i2p (a 2016) está basado en Apache Nutch<ref>https://en.wikipedia.org/wiki/Apache_Nutch</ref>.

Aplicaciones escritas en lenguaje Java.

Tutorial: ¡Escríbeme!

Cómo hospedar/ejecutar un motor de búsqueda descentralizado dentro de I2P[Bearbeiten]

YaCy[Bearbeiten]

Artículo principal: YaCy/es (describe cómo 'configurar un Yacy en clearnet para los usuarios de I2P', e intenta describir cómo indexar el contenido de I2P)

Está escrito en Java.

FAROO[Bearbeiten]

Parece una mala idea para I2P:

  • El cliente sólo funciona en windows
  • FAROO indexa el contenido web del usuario
  • Código fuente cerrado

Alimentando tu propio motor de búsqueda[Bearbeiten]

Fuentes con URLs de eepsites[Bearbeiten]

Fuentes desde el que tu propio motor de búsqueda puede descubrir URLs de webs ocultas.

Recomendación sobre cortesía[Bearbeiten]

Zzz escribió en el 2010<ref>http://zzz.i2p/topics/641-how-to-configure-your-i2p-search-crawler-e-g-yacy</ref> :

Veo más servidores Yacy registrándose. Hemos tenido problemas en el pasado por bots que no respetaban los robots.txt, o visitan demasiado las eepsites. Si esto será, o no, un problema con los nuevos motores de búsqueda, no lo sé.

Lo que debe hacerse es configurar tu motor de búsqueda con un identificador único en 'user agent', con información de contacto. Entonces configura tu túnel proxy cliente HTTP para enviar la cadena del 'user agent' real a través de la eepsite (normalmente el proxy cambia el 'user agnet' a "MYOB/6.66 (AN/ON)").

Ahora los operadores de las eepsites pueden ver el tráfico del robot y diagnosticar problemas, o bloquearlo totalmente.

Sabemos que no intentas que tu bot se convierta en bot DOS. Al permitirle identificarse, otros pueden descubrir fácilmente si se ha vuelto loco o está causando problemas.

Pon: i2ptunnel.httpclient.sendUserAgent=true

en las "custom options" en la página de edición del i2ptunnel de tu eeproxy. Guarda, para y reinicia el túnel.

Si no deseas esto en tu navegación habitual por las eepsites, configura un nuevo túnel HTTP cliente para Yacy.

Referencias[Bearbeiten]

<references />

See also[Bearbeiten]

Enlaces externos[Bearbeiten]