Buscador google google imagenes

23
BUSCADOR DE GOOGLE GOOGLE IMÁGENES

description

trabajo de google

Transcript of Buscador google google imagenes

Page 1: Buscador google google imagenes

BUSCADOR DE GOOGLE

GOOGLE IMÁGENES

Page 2: Buscador google google imagenes

GOOGLE

ALEXANDRA CHACON HERNANDEZ

OMAIRA MAMPOTES MONTES

LUZ VIVIANA HERRERA

SANDRA CABRERA PENCUE

SERVICIO NACIONAL DE APRENDIZAJE (SENA)

TECNOLOGO ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN

INGENIERIA Y DISEÑO DE SOFTWARE

PITAL-HUILA

2012

Page 3: Buscador google google imagenes

GOOGLE

ALEXANDRA CHACON HERNANDEZ

OMAIRA MAMPOTES MONTES

LUZ VIVIANA HERRERA

SANDRA CABRERA PENCUE

DIRECTOR:

PAULO ANDRES RINCON VIEDA

SERVICIO NACIONAL DE APRENDIZAJE (SENA)

TECNOLOGO ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN

INGENIERIA Y DISEÑO DE SOFTWARE

PITAL-HUILA

2012

Page 4: Buscador google google imagenes

OBJETIVO

GENERAL

Ofrecer conocimiento como un proceso multidireccional mediante el

cual se transmita información, conciencia y formas de aprender. La

educación no sólo se produce a través de la palabra, pues está

presente en todas nuestras acciones, vista y actitudes.

ESPECIFICOS

Dar a conocer un poco de la historia que abarca una de las

herramientas más utilizadas de internet, ya que a simple vista no se

obtiene un conocimiento a fondo sobre su concepto.

Aprender el significado de las palabras que genera una consulta de

búsqueda con miles de significados.

Page 5: Buscador google google imagenes

JUSTIFICACION

Page 6: Buscador google google imagenes

EL BUSCADOR DE GOOGLE O BUSCADOR WEB DE

GOOGLE

(en inglés:Google Search) es un motor de búsqueda en la web propiedad

de Google Inc., es el motor de búsqueda más utilizado en la Web,1 recibe cientos

de millones de consultas cada día a través de sus diferentes servicios.2 El objetivo

principal del buscador de Google es buscar texto en las páginas web, en lugar de

otro tipo de datos, fue desarrollado originalmente porLarry Page y Sergey Brin en

1997.3

El buscador de Google proporciona al menos 22 características especiales más

allá de la palabra original. Estas incluyen sinónimos, previsiones meteorológicas,

zonas horarias, cotizaciones de bolsa, mapas, datos sobre terremotos, cartelera

de cine, información de aeropuertos, listas de inicio y resultados deportivos. Hay

funciones especiales para los números, incluyendo intervalos (70 .. 73), precios,

temperaturas, conversiones de unidades y de monedas ("10,5 cm en pulgadas"),

cálculos ("3 * 4 + sqrt (6)-pi / 2"), seguimiento de paquetes, patentes, códigos de

área telefónico, y traducción de páginas mostradas.

El 12 de mayo de 2009, Google anunció que analizaría los micro formatos de

hCard, hReview y hProduct para incrementar las páginas de resultados de

búsqueda con lo que llamaron "Rich Snippets".6

En junio de 2011, Google introdujo "Google VoiceSearch" y "Google Images",

características que permiten a los usuarios buscar palabras al hablar y por

imágenes.7

A finales de junio de 2011, Google cambió el diseño de su página principal con el

fin de impulsar el uso de herramientas sociales.8 Los enlaces de publicidad, socios

de negocios e información de empresas fue llevada al borde inferior del

navegador. Uno de los cambios principales fue reemplazar la barra de navegación

clásica con una negra. El director creativo digital de Google Chris Wiggins explica:

"Estamos trabajando en un proyecto para proporcionarle una experiencia de

Google nueva y mejorada y en los próximos meses, seguirán viendo más cambios

de nuestra apariencia."9 La nueva barra de navegación fue recibida negativamente

por la mayoría.10

Page 7: Buscador google google imagenes

Al llegar a la página principal del buscador destaca la simplicidad de su interfaz,

donde se puede distinguir principalmente su logotipo (cambiante según diversos

eventos de distinta índole que puedan ser relevantes) las distintas categorías, el

cuadro, los botones y el ámbito de la búsqueda, además de un pequeño menú de

opciones.

El botón “voy a tener suerte” remite directamente al primer resultado, útil cuando

se busca cosas muy populares („Microsoft‟, „Renault‟, „Google‟, etc.) y un botón

“búsqueda avanzada” que permite concretar las búsquedas sin necesidad de

conocer todos los operadores que ofrece Google.

Además de la búsqueda básica, Google tiene múltiples funciones de búsqueda

avanzada para refinar las consultas.

Búsquedas y operadores simples

Las páginas web mantenidas por el Centro de Ayuda de Google tienen textos que

describen más de 15 diferentes opciones de búsqueda. Los operadores de

Google:

Uso de comillas: puede especificar al motor de Google que desea buscar una

expresión compuesta de dos o más palabras literalmente, escribiendo los términos

a buscar entre comillas.

“coches de ocasión” buscará todos los sitios que contengan la expresión "coches

de ocasión" textualmente.

AND: de forma predeterminada Google se lanza en busca de resultados uniendo

las palabras introducidas por el usuario utilizando este operador. Así el resultado

final de una búsqueda sin especificar nada o utilizando el operador AND serán los

resultados que contengan a la vez la lista de palabras especificada.

Las búsquedas "coches AND ocasión" o "coches ocasión" obtendrán los mismos

resultados, una lista de los sitios web que contengan la palabra coches y la

palabra ocasión.

OR o símbolo “|”: Si se desea especificar que no es necesaria la aparición de las

dos palabras en cada resultado de la búsqueda, sino cada una de ellas por

separado, se deberá especificar el operador OR entre los términos que deban

cumplir este criterio.

"coches OR ocasión" ahora se obtendrá como resultado una lista de los sitios web

que contengan el término coches u ocasión.

Page 8: Buscador google google imagenes

El operador +: Inclusión forzosa de una palabra, como "Nombre + de + el juego"

para forzar que las palabras "de" y "el" aparezcan en la búsqueda.

El operador –: permite excluir resultados de la búsqueda. Debe especificarse

antes del término a obviar para que se busquen los resultados que no contengan

la palabra especificada.

"coches –ocasión" buscara los sitios web que contengan la palabra coche pero no

ocasión.

El operador *: Busca cualquier palabra entre otras palabras específicas.

Se pueden asignar distintos ámbitos a los operadores delimitándolos con

paréntesis:

"(coches OR motos) AND ocasión" buscará todas las webs que contengan la

palabra coches o motos y con cualquiera de estas dos es indispensable que

aparezca ocasión.

Comandos especiales:

Definición: El prefijo de consulta "define:" va a dar una definición de las palabras

que aparecen después de ella.

Stocks: Después de "stocks" los términos de consulta son tratados como símbolos

de cotización de valores para la búsqueda.

Site: Restringir los resultados con los sitios web en el dominio dado, como por

ejemplo, site: www.acmeacme.com.La opción de "site:com" buscará todas las

direcciones URL con el nombre de dominio "com". (Sin espacio después de

"site:").

Allintitle: Sólo los títulos de páginas serán buscados (no el resto del texto en cada

página web).

Intitle: Prefijo para buscar en un título de página web, como "intitle:búsqueda de

google", aparecerá una lista páginas con la palabra "google" en el título, y la

palabra "búsqueda" en cualquier lugar (sin espacio después de "intitle:").

Allinurl: Sólo la dirección URL de las páginas serán buscadas (no el texto dentro

de cada página web).

Inurl: Prefijo para cada palabra que se encuentra en la URL, es decir que otros son

encontrados en cualquier lugar, tales como "inurl:búsqueda cumbre" coincide con

Page 9: Buscador google google imagenes

"cumbre" en un URL, pero "búsqueda" coincide en cualquier lugar (sin espacio

después de "inurl:"). Las opciones de visualización de la página (o tipos de

consulta) son los siguientes:

Cache: Destaca la búsqueda de palabras dentro del documento en el caché, como

"cache:www.google.com xxx" muestra el contenido del caché con la palabra "xxx"

sobresaltada.

Link: El prefijo "link:" mostrará una lista de páginas web que tienen enlaces a la

página web especificada, como por ejemplo "link:www.google.com" listas de

páginas web que enlazan con la página principal de Google.

Related: El prefijo "related:" mostrará una lista de páginas web que son "similares"

a una página web especificada.

Info: El prefijo "info:" mostrará alguna información sobre una página web

especificada, como por ejemplo, info:www.google.com. Por lo general, la

información es el primer texto (160 bytes, cerca de 23 palabras) que figura en la

página, se muestra en el formato de resultados.

Filetype: los resultados sólo muestran los archivos del tipo deseado (por ejemplo:

filetype:pdf volverá archivos pdf)

Tenga en cuenta que Google busca en el código HTML dentro de una página web,

no la apariencia de la pantalla: las palabras que aparecen en una pantalla no

necesariamente tienen que estar en el mismo orden que en el código HTML.

Características especiales

Además de la principal función de motores de búsqueda de texto, el Buscador de

Google tiene más de 22 "características especiales" (que se activa al escribir

cualquiera de las docenas de palabras de activación)en la búsqueda:

El clima: Las condiciones climáticas, temperatura, viento, humedad y pronóstico,

para muchas ciudades, se puede ver escribiendo "clima", junto con una ciudad

para las grandes ciudades o ciudad y estado, código postal EE.UU. o de la ciudad

y el país de las ciudades más pequeñas (como por ejemplo: clima Lawrence,

Kansas, clima de París, clima Bremen, Alemania).

Cotizaciones de la bolsa: Los datos del mercado para una compañía específica

o fondo se puede ver, escribiendo el símbolo (o incluir "acciones"), tales como:

CSCO ; MSFT ; las acciones de IBM; acciones F (listas de Ford Motor Co.), o

AIVSX (fondo).Los resultados muestran cambios día a día, o un gráfico de 5 años,

Page 10: Buscador google google imagenes

etc. Esto no funciona para los nombres de archivo que tienen una sola letra como

abreviación, como Citigroup (C) o Macy (M) (Ford es una excepción), o palabras

comunes, como por ejemplo Diamond Offshore (DO) o Majesco (COOL).

Hora: La hora actual en muchas ciudades (en todo el mundo), pueden ser vistos

escribiendo "hora" y el nombre de la ciudad (tales como: hora de El Cairo, hora de

Pratt, KS).

Resultados deportivos: Las puntuaciones y los horarios, para los equipos

deportivos, se pueden mostrar escribiendo el nombre del equipo o nombre de la

liga en el cuadro de búsqueda.

Conversión de unidades: Las medidas pueden ser convertidas mediante la

introducción de cada frase, como por ejemplo: 10,5 cm en pulgadas, o 90 km en

millas

Conversión de moneda: Un conversor de dinero o moneda puede ser

seleccionado, escribiendo los nombres o códigos de moneda (que se enumeran

en la norma ISO 4217): 6.789 euros en USD, 150 libras esterlinas en dólares,

5.000 yenes en dólares, 5.000 yuanes en lira (el dólar de EE.UU. puede de USD, o

"US$" o "$", mientras que el canadiense es CAD, etc.)

Calculadora: Cálculo de los resultados se puede determinar, según los cálculos

en vivo, mediante la introducción de una fórmula de números o palabras, como por

ejemplo: 6 * 77 + pi + sqrt(e^3)/888 más 0,45.El usuario tiene la opción de buscar

por la fórmula después del cálculo. La calculadora también utiliza la unidad y las

funciones de conversión de divisas para permitir cálculos de unidad. Por ejemplo,

"(3 euros/litro) / (40 millas/galón) en USD / millas", calcula el costo en dólares por

milla para un coche de 40 millas por galón de gasolina que cuesta 3 euros por litro.

El acento circunflejo "^" plantea un número a un exponente de potencia. También,

los porcentajes son permitidos ("40% de los 300"). Existen ciertos debates en

cuanto al cálculo de Google de 0 ^ 0. Muchos matemáticos creen que 0 ^ 0 no

está definido, pero la calculadora de Google muestra el resultado como 1.30

Rangos numéricos: Un conjunto de números se puede adaptar con un doble de

puntos entre los números de serie (70..73 ó 90..100) para adaptarse a cualquier

número positivo en el rango. Los números negativos son tratados como el uso de

la exclusión del guion para no coincidir con el número. Negative numbers are

treated as using exclusion-dash to not match the number.

Page 11: Buscador google google imagenes

Diccionario de búsqueda: Una definición de una palabra o frase se puede

encontrar, mediante la introducción de "definir" seguido de dos puntos y la(s)

palabra(s) de búsqueda (por ejemplo, "define: la filosofía")

Mapas: Algunos mapas relacionados se pueden mostrar, simplemente

introduciendo el nombre o el código postal de los EE.UU. y la palabra "mapa"

(tales como: mapa de Nueva York, mapa de Kansas o mapa de París). Sin

embargo, actualmente es imposible encontrar ciudades, calles o direcciones que

correspondan a un negocio.

Cartelera de cine: Comentarios u horarios de películas pueden ser listados para

cualquier película que esté en el cine, si escribe "películas" o el nombre de una

película en el cuadro de búsqueda. Si un sitio específico se guarda en una

búsqueda anterior, el resultado de la búsqueda mostrará horarios de los cines

cercanos para esa película.

Datos públicos: Tendencias de la población (o las tasas de desempleo) se

pueden encontrar para los estados de EE.UU. y los condados, al escribir

"población" o "tasa de desempleo", seguido de un nombre de estado o condado.

Bienes raíces y viviendas: los listados de un área determinada se puede mostrar

usando las palabras "vivienda", "casa" o "bienes inmuebles" seguido del nombre

de una ciudad o código postal EE.UU.

Datos de viaje / aeropuertos: El estado de los vuelos de llegadas y salidas de

vuelos EE.UU. se puede mostrar, simplemente introduciendo el nombre de la

aerolínea y el número de vuelo en el cuadro de búsqueda (como por ejemplo:

American Airlines 18).Las demoras en un aeropuerto determinado también se

puede ver (al escribir el nombre de la ciudad o el código de tres letras del

aeropuerto más palabra "aeropuerto").

Seguimiento de paquetes: el correo enviado puede ser rastreado al escribir el

número de seguimiento de un correo de Royal Mail, UPS, FedEx o USPS

directamente en el cuadro de búsqueda. Los resultados incluirán enlaces para el

seguimiento del estado de cada envío.

Números de patente: las patentes estadounidenses pueden ser buscadas

mediante la introducción de la palabra "patente", seguido por el número de patente

en el cuadro de búsqueda (como por ejemplo: Patente 5123123).

Page 12: Buscador google google imagenes

Código de área: La ubicación geográfica (por cualquier código de área telefónico

en los estados unidos) se pueden mostrar escribiendo un código de área de 3

dígitos (por ejemplo: 650).

Sinónimo de búsqueda: La búsqueda puede coincidir con palabras similares a

las especificadas poniendo el signo "~" inmediatamente delante de un término de

búsqueda, tales como: ~ comida rápida.

Búsqueda cifrada

En mayo de 2010 Google lanzó su sistema de cifrado SSL de búsqueda web.31 La

búsqueda cifrada puede ser accedida por encrypted.google.com32

Características

El buscador de Google consiste de una serie de sitios web. El más grande de

ellos, el sitio google.com, es la página web más visitada del mundo.33 Algunas de

sus características incluyen un enlace que proporciona la definición para la

mayoría de las búsquedas incluyendo palabras del diccionario, el número de

resultados que obtuvo en su búsqueda, enlaces a otras búsquedas (por ejemplo,

palabras que Google cree que son incorrectas, le proporciona al usuario un enlace

a los resultados de búsqueda utilizando la ortografía propuesta por Google), y

muchos más.

Google +1

Google +1 ayuda a las personas a descubrir contenido relevante y cuya meta es

incrementar los resultados de búsqueda de Google, ofreciendo un estado para

mostrarles a las personas si la página es confiable. Cuando un usuario de Google

utiliza los resultados de búsqueda de Google mostrará un botón +1 para

recomendar la página y una anotación con los nombres de las conexiones de los

usuarios que han recomendado su página.

Características de la interfaz

Fondo blanco y sencillo con cambios de vez en cuando en el título, este cambio

ocurre en días con significado histórico o días determinados.

La barra superior tiene: Web, imágenes, videos, mapas, noticias, compras, gmail,

etc.

Búsqueda por voz, permite una búsqueda más rápida que escribiendo, o si la

escritura correcta no se conoce.

Page 13: Buscador google google imagenes

Cuando utilizas tu cuenta de Google, el historial de búsqueda se registra

automáticamente.

Google Instant, que rápidamente genera búsquedas posibles que contengan los

caracteres escritos. Por ejemplo, si escribes Goo, mostraría Google, Google maps,

Google Translate...

Funciones para comunicación

Comparte tus fotos con el mundo. Es posible subir a la web tus fotos.

Búsquedas de imágenes con ajustes opcionales, tales como tamaño, color, tipo y

clasificación.

Búsquedas de vídeos que se conectan a YouTube. También con ajustes

opcionales tales como la duración, tiempo, calidad, además de otras fuentes que

se relaciona con el tema que usted está buscando.

Google bomb

A raíz de su importante posición de liderazgo en el mercado, Google es objetivo

principal del así llamado spamming contra buscadores. En este sentido se intenta

posicionar la mayor cantidad posible de palabras de búsqueda entre los primeros

resultados. Estas palabras claves muchas veces no tienen ninguna relación con el

contenido real de las páginas. Se utilizan técnicas como Páginas-Doorway, Farm-

Links o Page-Cloacking.

Esta posibilidad se comprobó por vez primera a la luz de la opinión pública en

relación con una Bomba-Google, que estaba orientada al presidente de

los Estados Unidos George W. Bush. La palabra de búsqueda "miserable failure"

(en castellano: "fracaso miserable") fue enlazada por los adversarios de Bush a la

página oficial con la biografía de Bush en la Casa Blanca.34

Como contrapartida intentaron los partidarios de Bush hacer lo mismo

contra Michael Moore (director del documental Fahrenheit 9/11). Desde ese

momento los primeros puestos varían frecuentemente entre ambos.

Las manipulaciones que tienen como objetivo mejorar el ranking de websites

especialmente en Google, son consideradas desde ese momento Google-

Spamming. Para evitar el abuso, Google cambia su algoritmo con frecuencia.

Page 14: Buscador google google imagenes

Logotipo (Doodle)

En ciertas ocasiones, el logotipo en la página web de Google va a cambiar a una

versión especial, conocido como "Google Doodle".Al hacer clic en Doodle, llevará

al usuario a una cadena de resultados de búsqueda de Google sobre el tema. El

primero fue una referencia al Festival BurningMan en 199835 36 y otros han sido

producidos para el cumpleaños de personas notables como Albert Einstein, los

acontecimientos históricos como el 50 aniversario del bloque de Lego y días

festivos como el Día de San Valentín.37

Consumo de energía

Google afirma que cada consulta requiere de alrededor de 1 kJ o 0,0003 kW h.38

Optimización de Google

Artículo principal: Posicionamiento en buscadores.

Puesto que Google es el buscador más popular, muchos webmasters desean

influenciar la clasificación de su sitio web en Google. Una industria de consultores

ha surgido para ayudar a los sitios web a aumentar su ranking en Google y en

otros motores de búsqueda. Este campo, llamado optimización de motores de

búsqueda (SEO en inglés), trata de discernir patrones en los listados de motores

de búsqueda y luego desarrollar una metodología para mejorar la clasificación y

atraer a más usuarios a los sitios de sus clientes.

La optimización de motores de búsqueda abarca tanto factores en la página (como

el cuerpo del texto, los elementos del título, los elementos del título y la imagen de

los valores del atributo alt) y factores de optimización fuera de la página (como

texto de anclaje y el PageRank).La idea general es afectar el algoritmo de

relevancia de Google mediante la incorporación de las palabras claves en la

página, en particular el título y el cuerpo del texto (nota: mientras más arriba esté

en la página, mayor son las posibilidades de la prominencia de palabras clave y

por lo tanto, su clasificación). Sin embargo, demasiadas repeticiones de la palabra

clave causan que la página para buscar luzca sospechosa para el algoritmo de

control Google que evita spam.

Google ha publicado una guía para propietarios de sitios web que deseen mejorar

su clasificación en el uso de consultores legítimos de optimización

Page 15: Buscador google google imagenes

Sistema Distribuido

Un sistema distribuido es un conjunto de computadoras separadas físicamente y

conectadas entre sí por una red de comunicaciones distribuida. Google es uno de

los sistemas distribuidos más complejos en uso. Su infraestructura ha satisfecho

requisitos necesarios como: escalabilidad, rendimiento, fiabilidad y carácter

abierto.

Escalabilidad: Google necesita perfeccionar la escalabilidad ya que es un

sistema distribuido con varios subsistemas, dando servicio a millones de usuarios.

Se encuentra con problemas de escalabilidad en las siguientes dimensiones:

Tiene que ir lidiando cada vez con más datos.

Lidiar con más peticiones con el crecimiento de usuarios.

Busca mejores resultados.

Fiabilidad: el sistema debe funcionar en todo momento, sobre todo la

funcionalidad de búsqueda que debe estar disponible las 24 horas. Google ofrece

un acuerdo de nivel de servicios del 99,9%.

Rendimiento: el rendimiento general del sistema es crítico para Google,

especialmente para conseguir una latencia baja en las interacciones de usuarios.

Cuanto mejor sea el rendimiento, hay más probabilidades de que el usuario vuelva

a hacer más búsquedas.

Transparencia: hay una gran necesidad de transparencia para soportar el

desarrollo de nuevas aplicaciones y la extensibilidad del servicio web.

Aspectos del motor de búsqueda

Rastreo (crawling)

La tarea de un crawler es localizar y obtener los contenidos de la Web y pasar el

contenido a subsistemas de indexado. Para ello se utiliza el

software Googlebot que, recursivamente, lee una página web dada obteniendo los

enlaces y planificando nuevas operaciones de rastreo. La frecuencia de las visitas

depende de cuánto cambia la página.

Google Caffeine: En agosto de 2009, Google anunció el lanzamiento de una

arquitectura de búsqueda nueva, con nombre código "cafeína". La nueva

arquitectura fue diseñada para obtener resultados más rápido y funcionar mejor

Page 16: Buscador google google imagenes

con la información actualizada continuamente de servicios como Facebook y

Twitter. Los desarrolladores de Google señalaron que la mayoría de los usuarios

no notarían un cambio inmediato, pero invitaron desarrolladores a probar su nuevo

motor de búsqueda de manera aislada para proteger el programa. Las diferencias

notadas por su impacto en la optimización del motor de búsqueda incluye más

ponderación de palabras claves y toma en consideración los años que tiene el

dominio. Esta medida fue interpretada por algunos como una respuesta al

lanzamiento al mercado de una versión mejorada de un servicio de búsqueda de

Microsoft, renombrado a Bing. Google anunció la culminación de "cafeína" el 8 de

junio de 2010, declarando que tenían resultados 50% más recientes debido a la

continua actualización de su índice. Con "cafeína", Google cambió su plataforma

de indexación back-end de MapReduce a BigTable."Cafeína" también se basa en

Coloso, o GFS2, una reforma del sistema de distribución de archivos EFP.

Con la introducción de Caffeine en 2010, Google pasa a una aproximación más

continua con la intención de ofrecer más frescura en términos de resultados de

búsqueda. Caffeine utiliza un nuevo servicio de infraestructura llamada Percolator

que admite actualización incremental de grandes conjuntos de datos.

Indexación

Produce un índice de contenidos similar al de un libro. Técnicamente se denomina

indexado inverso de palabras que aparecen en páginas web y otros recursos

textuales como documentos en .pdf, .doc y otros formatos. No solo guarda la

posición, también almacena otra información relevante como el tamaño de fuente

y capitalización. Utilizando este índice, se reduce el número de páginas candidatas

de miles de millones a unas decenas de miles, según el poder discriminativo de

las palabras buscadas.

La indexación también mantiene un índice de enlaces, llevando un seguimiento de

qué páginas apuntan a una página web.

Datos no indexables: A pesar de su índice inmenso, también existe una

considerable cantidad de información disponible en bases de datos en línea que

se puede acceder por medio de consultas, pero no por enlaces. Esta "Internet

profunda" o "Internet invisible" está mínimamente cubierta por Google y otros

motores de búsqueda.40 La Internet profunda contiene catálogos de bibliotecas,

documentos oficiales legislativos de los gobiernos, guías telefónicas y otros

contenidos que son dinámicamente preparados para responder a una consulta.

Page 17: Buscador google google imagenes

Clasificación (Ranking)El problema con el indexado es que no proporciona

información sobre la importancia relativa de las páginas web que contienen un

conjunto de palabras clave. Todos los motores de búsqueda modernos tienen una

clasificación que indica la importancia de la página y asegura que las más

importantes aparecen en los primeros puestos de la lista de resultados.

Google utiliza el algoritmo PageRank para decidir la importancia de la página web.

Está basado en los sistemas de ranking de las publicaciones científicas, un

artículo es importante si ha sido citado por otros colegas del área. El ranking en

Google también tiene en cuenta factores relacionados con la proximidad de la

búsqueda a las palabras clave de la página obtenidas en el indexado inverso.

PageRank: La llegada de Google al éxito fue en gran parte debido a un algoritmo

patentado llamado PageRank que ayuda a clasificar las páginas web que

coincidan con una cadena de búsqueda.41 Cuando Google era un proyecto de

investigación de Stanford, fue apodado BackRub, porque la tecnología comprueba

los vínculos para determinar la importancia de un sitio.

Los anteriores métodos basados en palabras claves utilizados por muchos

motores de búsqueda que fueron una vez más popular que Google, clasificaban

las páginas por la frecuencia con que los términos de búsqueda ocurrían en la

página o qué tan frecuentemente fueron asociados los términos de búsqueda en

cada página de resultados.

El algoritmo de PageRank analiza los enlaces generados por el usuario

asumiendo que las páginas web enlazadas desde muchas páginas importantes

tienen probablemente la misma importancia. El algoritmo calcula una puntuación

recursiva de páginas, basado en la suma ponderada del PageRank de las páginas

con enlaces a ellos. Se cree que PageRank se correlaciona bien con los

conceptos de importancia para las personas.

Además de PageRank, Google ha añadido muchos otros criterios no mencionados

para determinar la clasificación de las páginas de las listas de resultados, se

reportó que hay más de 200 indicadores diferentes.42 43 Los detalles específicos

de los cuales se mantienen en secreto para permitirle a Google mantener una

ventaja sobre sus competidores a nivel mundial.

Arquitectura física adoptada por Google

La filosofía de Google en términos de infraestructura física es el uso de un gran

número de PCs como base para producir un entorno para computación y

Page 18: Buscador google google imagenes

almacenamiento distribuido. Típicamente un PC tendrá 2 TB de disco, 16 GB

de DRAM y utiliza una versión reducida del kernel de Linux.

Estrategias contra fallo: al utilizar PCs de bajo coste, Google reconoce que

partes de su infraestructura fallan, y por tanto se han diseñado unas estrategias

para tolerar dichos fallos.

El origen de fallos más común es debido a software, con unas 20 máquinas que

necesitan ser reiniciadas al día manualmente por problemas de software.

Los problemas de hardware representan 1/10 de los fallos. El 95% son fallos de

disco o de DRAM.

Esta información confirma la decisión de utilizar PCs de bajo coste dado el gran

número de fallos debidos al software. No merece la pena invertir en PCs más

caros.

Arquitectura física: está compuesta por los siguientes componentes

Los PCs están organizados en racks de entre 40 y 80 equipos. Cada rack tiene

un switch de Ethernet que provee conexión en el rack y hacia el exterior.

Los racks están organizados en clusters formados por 30 racks o más. Un cluster

es una unidad básica de gestión que tiene determinado, por ejemplo, la

localización y replicación de servicios. Cada rack está conectado a dos switches

de banda ancha para que haya redundancia.

Los clusters se encuentran en centros de datos de Google que están repartidos

por el mundo. En el 2000 Google tenía dos centros de datos en Silicon Valley y

uno en Virgina. Desde entonces el húmero ha aumentado significantemente y hay

centros de datos en Estados Unidos, Irlanda, Bélgica, Japón, China, etc.

Capacidad de almacenamiento: si cada PC ofrece 2 TB de almacenamiento,

entonces un rack de 80 PCs ofrece 160 TB, con un cluster de 30 racks se ofrecen

4,8 petabytes. No se conoce exactamente el número de máquinas que tiene la

compañía pero podemos asumir que cuentan con unos 200 clusters, que ofrecen

960 petabytes de almacenamiento, casi 1 exabyte (10^18 bytes).

Middleware

Artículo principal: Middleware.

Page 19: Buscador google google imagenes

El sistema está compuesto por un grupo de servicios distribuidos que ofrecen

funcionalidad a los desarrolladores. Están divididos en las siguientes categorías:

Paradigmas de comunicación, que incluyen servicios para comunicaciones tanto

remotas como multicast.

Protocol buffers: ofrecen un formato de serialización común.

Publish-subscribe: servicio para la diseminación de eventos.

Datos y coordinación, porporciona almacenamiento y acceso coordinado a

datos.

GFS: ofrece un sistema de ficheros optimizado para las necesidades de Google,

incluyendo el almacenamiento de ficheros de gran tamaño.

Chubby: soporta la coordinación de servicios y el almacenamiento de volúmenes

pequeños de datos.

Bigtable: base de datos distribuida construida sobre GFS/Chubby.

Computación distribuida, proporciona servicios para el uso de computación

paralela y distribuida sobre la arquitectura física.

MapReduce: soporta computación distribuida sobre conjuntos de datos grandes.

Sawzall: es un lenguaje de alto nivel para la ejecución de computaciones

distribuidas.

Mensajes de error

Algunas búsquedas dará el error "403 Forbidden error" con el texto

"Lo sentimos... ... pero tu consulta se parece a las solicitudes automatizadas de un

virus informático o aplicación de spyware. Para proteger a nuestros usuarios, no

podemos procesar su solicitud por los momentos. Vamos a restaurar su acceso

tan pronto como sea posible, inténtelo de nuevo en unos minutos. Mientras tanto,

si usted sospecha que su computadora o red ha sido infectada, es posible que

desee ejecutar un antivirus o eliminador de spyware para asegurarse de que sus

sistemas estén libres de virus y otras aplicaciones malignas. Pedimos disculpas

por las molestias, y esperamos su pronto regreso a nuestra plataforma de

Google."

A veces, seguido de un sistema CAPTCHA.

Page 20: Buscador google google imagenes

La pantalla fue reportada por primera vez en 2005 y fue una respuesta a la fuerte

utilización de Google por empresas de optimización de búsquedas para verificar el

rango de los sitios que optimiza. El mensaje es provocado por un gran volumen de

solicitudes a partir de una única dirección IP. Google al parecer utiliza cookies

como parte de su protocolo para determinar si rechaza el servicio o no.

En junio de 2009, después de la muerte de la superestrella del pop Michael

Jackson, apareció este mensaje a muchos usuarios de internet que estaba

buscando en Google las noticias relacionadas con el cantante y fue asumido por

Google que fue un ataque DDoS, aunque muchas preguntas fueron presentadas

por buscadores legítimos.

Error de software en enero de 2009

Google etiqueta resultados de búsqueda con el mensaje "Este sitio puede dañar tu

equipo" si el sitio es conocido por instalar software malicioso. Google hace esto

para proteger a los usuarios que visiten este tipo de sitios web. Por

aproximadamente 40 minutos el 31 de enero de 2009, todos los resultados de

búsquedas fueron clasificados erróneamente como malware y por lo tanto, no se

podía hacer clic en él. En su lugar, aparecía un mensaje de aviso al usuario y era

requerido que el usuario introdujera la dirección URL solicitada de forma manual.

Este problema fue causado por un error humano.46 47 48 49 La dirección URL de "/"

(que se expande a todas las URLs) fue agregado por error en el fichero de

patrones de malware.

Google está disponible en muchos idiomas y ha sido modificado por completo o en

parte, para muchos países.50

Page 21: Buscador google google imagenes

Google Imágenes

Es una especialización del buscador principal para imágenes, que fue

implementado en el año 2001. Contiene en su interfaz distintas herramientas de

búsqueda, que sirven para filtrar los resultados de las imágenes. Estos pueden ser

según su tamaño (en pequeñas, medianas y grandes), tipo, formatos (JPG, GIF y

PNG), por coloración (Blanco y negro, escala de grises y en color), por color (rojo,

naranja, amarillo, verde, verde azulado, azul, púrpura, rosa, blanco, gris, negro y

marrón), por fecha, y por imágenes similares.

El 20 de julio del 2010 fue lanzado un nuevo diseño cuya principal característica

consiste en que cuando el usuario pasa el cursor sobre encima de la fotografía, sin

necesidad de hacer clic, la foto se amplía y debajo de la imagen en miniatura se

muestra un detalle de la información.

Otra función que ha sido lanzada en 2011 es que, arrastrando una imagen hasta la

barra del buscador, es posible buscar información sobre dicha imagen en la web.

Además, contiene una herramienta llamada Safe Search,1 que evita que aparezca

contenido para adultos en los resultados de búsqueda. Google utiliza métodos

automatizados para identificar contenido ofensivo y basándose en los comentarios

de los usuarios. En el caso de contenido sexualmente explícito, el filtro se basa

principalmente en algoritmos que tienen en cuenta diversos factores, incluidos

enlaces, palabras clave e imágenes. Aunque ningún filtro es fiable al 100%,

SafeSearch ayuda a excluir la mayor parte de este tipo de contenido.

El objetivo que persigue Google con la búsqueda de imágenes es el mismo que

aplicamos a la búsqueda web: ofrecer a los usuarios los resultados de búsqueda

mejor y más relevante. Si sigue las prácticas recomendadas que indicamos a

continuación (así como nuestras directrices habituales para webmasters), la

probabilidad de que sus imágenes aparezcan en los resultados de búsqueda será

mayor.

No inserte texto importante en imágenes

Evite insertar texto importante en imágenes de elementos como, por ejemplo,

encabezados de páginas y elementos del menú, ya que no todos los usuarios

pueden acceder a ellos. Para garantizar la máxima accesibilidad de su texto

importante en función del contenido, utilice el formato HTML habitual.

Page 22: Buscador google google imagenes

Proporciónenos la mayor cantidad posible de información sobre la imagen Utilice

nombres de archivo informativos y detallados para las imágenes

El nombre de archivo proporcionará a Google información sobre el tema de la

imagen. Procure que el nombre de archivo ofrezca una buena descripción del

tema de la imagen. Por ejemplo, mi-nuevo-gatito-negro.jpg es un nombre de

archivo más informativo que IMG00023.JPG. Los nombres de archivo descriptivos

también pueden ser útiles para los usuarios: si no podemos encontrar un texto

adecuado en la página en la que encontramos la imagen, utilizaremos el nombre

de archivo como fragmento de la imagen en los resultados de búsqueda.

Page 23: Buscador google google imagenes

CONCLUSION

Google es un motor de búsqueda que utiliza enlaces para determinar la

importancia de páginas web concretas, ofreciendo viabilidad y solución a nuestras

preguntas de una manera eficaz y concreta, gracias a esta plataforma,

encontramos una biblioteca organizada a nuestra disposición y de aquí la

importancia de conocer sus trucos y consejos a la hora de utilizarla.