Cómo puedo importar datos externos

Esta nueva función permite obtener información de tipos de archivo como .xml, .html, .csv o .tsv, así como de feeds RSS y Atom que podrías leer hoy en Google Reader.

Recuerda que: Estas funciones sólo pueden leer archivos públicos disponibles. Si un archivo está protegido por un cortafuegos, o si se debe iniciar sesión para verlo, no podremos extraer contenido de él. Sólo podrás hacer referencia a datos de otras hojas de cálculo cuando éstas se publiquen.

Además, el límite de funciones por cada hoja de cálculo es de 50.

Funciones:

=importXML("URL","consulta")

  • URL: la URL del archivo XML o HTML.
  • consulta: la consulta XPath que se va a aplicar en los datos proporcionados en la URL. Por ejemplo, "//a/@href" devuelve una lista con los atributos href de todas las etiquetas <a> del documento (es decir, todas las URL con las que está enlazado el documento). Para obtener más información sobre XPath, consulta http://www.w3schools.com/xpath/
  • Ejemplo: =importXml("www.google.com", "//a/@href"). Esto devuelve todos los atributos href (las URL enlazadas) de todas las etiquetas <a>de la página principal de www.google.com.

=importData("URL")

  • URL: la URL del archivo CSV o TSV. Esta acción importa un archivo separado por comas o tabuladores.

=ImportHtml(URL, "lista" | "tabla", índice). Importa los datos de una lista o tabla específica de una página HTML. Los argumentos de la función son los siguientes:

  • URL: la URL de la página HTML
  • "lista" o "tabla" para indicar el tipo de estructura que se extraerá de la página web. Si es "lista", la función buscará el contenido de las etiquetas <UL>, <OL> o <DL>; si es "tabla", el de las etiquetas <TABLE>.
  • índice: el índice basado en 1 de la tabla o de la lista de la página web de origen. Los índices se mantienen por separado, por lo que podría haber una lista #1 y una tabla #1.
  • Ejemplo: =ImportHtml("http://en.wikipedia.org/wiki/Demographics_of_India", "tabla",4). Esta función devuelve información demográfica sobre la población de India.

=ImportFeed(URL, [feedQuery | itemQuery], [headers], [numItems]). Esta función importa un feed RSS o ATOM, al igual que se puede hacer en Google Reader. Los argumentos de la función son los siguientes:

  • URL: la URL del feed RSS o ATOM.
  • feedQuery/itemQuery: una de las siguientes cadenas de consulta: "feed", "título de feed", "autor de feed", "descripción de feed", "URL de feed", "elementos", "autor de elementos", "título de elementos", "resumen de elementos", "URL de elementos" o "elementos creados". Las consultas de feed devuelven propiedades del feed de modo general: el título del feed, autor del feed, etc. Nota: para obtener los datos del feed, debes introducir una solicitud "elementos".
  • La consulta "feed" devuelve la información del feed en una sola fila.
  • La consulta "feed <tipo>" devuelve la información solicitada del feed en una sola celda.
  • La consulta "elementos" devuelve una tabla completa con la información de todos los elementos del feed.
  • La consulta "elementos <tipo>" devuelve la información solicitada de cada elemento en una sola columna.
  • Si una consulta determinada empieza por "feed", el parámetro "numItems" no es necesario y se sustituye por los parámetros de encabezado opcionales.
  • Si una consulta determinada empieza por "items", el parámetro "numItems" debe aparecer como tercer parámetro, y los encabezados en cuarto lugar.
  • encabezados: "true" para los encabezados de columna. Esta acción añadirá una fila más a la parte superior y etiquetará las columnas del resultado.
  • Ejemplo: =ImportFeed("http://news.google.com/?output=atom")