Buscando...
12 noviembre 2010
13:26

Google lanza una aplicación que limpia los datos

Google ha actualizado y relanzado una aplicación de código abierto que permite limpiar, analizar y transformar los datos. Se llama Google Refine.

Esta aplicación se llamaba, originalmente, Freebase Gridworks y era propiedad de Metaweb, empresa que Google compró el pasado mes de julio.

Google Refine es una recopilación de herramientas que puede ser muy útil cuando se quiere eliminar información útil, especialmente cuando tiene contradicciones.

Se trata de una aplicación para un computador que puede, por ejemplo, localizar todas las diferentes formas en las que se ha escrito una palabra y reemplazarla por la versión correcta.

Además, este proceso es compatible con cualquier base de datos o recopilación que tenga el usuario, sin necesidad de re escribir el código para cada una de ellas.

Otras utilidades de este software incluyen una expresión de lenguaje que puede ser utilizada para analizar un conjunto de datos. Los filtros se pueden utilizar para aislar determinados datos, que posteriormente pueden ser analizados o cambiados a través de unos comandos.

La aplicación trabaja con archivos de textos, de manera que los datos puedan ser separados en columnas y por el uso de comas. Los resultados se pueden exportar al formato JSON (JavaScript Object Notation), que permite ser transformados fácilmente en tablas HTML y otros formatos.

En función de la memoria de la computadora del usuario, la aplicación puede trabajar con hasta cientos de miles de filas de datos.

Google Refine 2.0 también permite enlazar grabaciones a otras bases de datos, entre otras muchas funciones. (IDG COMMUNICATIONS)

0 comentarios:

 
Back to top!