Vigilancia Tecnologica… En busca de lo necesario


El origen de este post viene fundamentado en la necesidad de dejar plasmados todos los fundamentos, alternativas y pasos a seguir a la hora de construir un modelo de vigilancia tecnologia (tanto a nivel empresarial como personal).

A modo de manual iré describiendo los pasos a seguir en la creación de un sistema de vigilancia, sencillo y a la vez escalable.

Dado el ingente volumen da datos que existe en la web (“la infoxicacion“), el método de vigilancia se hace recomendable tanto personal como profesionalmente para conocer, ver y sacar partido de la información que estemos buscando, y de eso se han dado cuenta importantes sitios como yahoo y google, poniendo a nuestra disposición varias formas de tener acceso a la generación, modificación y relación de la información.

Sistemas de Alertas Basicos

Partimos de los RSS, “RSS son las siglas de Really Simple Syndication, un formato XML para indicar o compartir contenido en la web. Se utiliza para difundir información actualizada frecuentemente a usuarios que se han suscrito a la fuente de contenidos”. El problema que nos surge en algunos ámbitos, es la ausencia de fuentes RSS, no todos los recursos que existen en internet disponen de un sistema de sindicación y dado el alto volumen de actualizaciones es difícil su seguimiento.

En nuestro caso concreto , para comenzar con el diseño de este sistema de vigilancia partiríamos de tres webs a modo de ejemplos de construcción de dicho modelo.

  • Boletin Oficial del Estado
  • Boletin oficial del Principado de Asturias
  • RED.es , en su apartado de licitaciones en ” Perfil del Contratante”

En la primera de las webs a seguir disponemos de RSS por lo que ya no tendríamos que crear feed de esta. De las otras dos, la creación de la fuente RSS, seria por nuestra cuenta, a través de los servicios (por ver las dos alternativas) :

  • Feed43
  • Yahoo Dapper

Comenzamos creando el feed del BOPA con “Feed43”

  • Nos creamos una cuenta en feed43,

Especificamos la dirección del sitio web a sindicar, cargaríamos la web en código fuente “RELOAD”. Tras cargar el código fuente del citado recurso, buscamos patrones de repetición, “Definir las reglas de extracción” es de la tareas más complicadas del proceso y que en otras fuentes de obtención RSS esta mas sistematizada. (nota el encoding del BOPA es UTF-8, para que salgan acentos)

En nuestro caso concreto los patrones a buscar seria:

<dl><dt>{%}<strong>{%}</strong></dt><dd><a title=”Texto de la disposición” href=”{%}”>Texto de la disposición</a></a>

“Extraemos” y nos daría las coincidencias para esos patrones, ahora definimos el formato de salida y las propiedades del RSS

http://feed43.com/4416322172323165.xml

Tan solo nos restaría utilizar la dirección de nuestro feed para incrustarla en cualquier lector RSS o como haremos posteriormente usarlo en yahoo pipes.

Ahora usaremos la alternativa 2, yahoo dapper. Nos logueamos con nuestra cuenta de google:

Es mucho más intuitivo que el feed43 ya que la interfaz de la izquierda se guía por los pasos a crear el “dapp”:

Insertamos la dirección de la página a crear el feed, siguiente paso seleccionamos el contenido a sindicar

Grabamos el campo con un nombre

Y ya nos dará una pre-visualización del extracto del contenido escogido, selecciones el contenido y pondremos el nombre al “dapp” . ya guardado accedemos a la pantalla de formato de salida del dapp , escogemos RSS Feed

Escogemos en las opciones de creación del feed y posteriormente vamos al botón RSS (naranja) ahí crearíamos el feed realmente, en nuestro caso:

http://open.dapper.net/transform.php?dappName=pruebav_2&transformer=RSS&extraArg_title=convocatoria&extraArg_description[]=convocatoria&applyToUrl=http%3A%2F%2Fwww.red.es%2Fredes%2Fcontratacion

Lo mismo que en el caso anterior nos podríamos suscribir desde un lector RSS (gestor de noticias o navegador) a este feed. Pero como vimos anteriormente, sobre estos contenidos actuaremos para depurar aún más la información arrojada, pues imaginemos que hayamos accedido a 10 o más fuentes RSS, no sería operativa la información arrojada.

Es el momento de reunir todas la fuentes que hayamos conseguido y filtrarlas como queramos a través de ” yahoo pipes”. Una herramienta potentísima que en nuestro caso usaremos muy limitadamente. Nos permite crear mashups “es una página web o aplicación que usa y combina datos, presentaciones y funcionalidad procedentes de una o más fuentes para crear nuevos servicios”. Igualmente nos damos de alta mediante nuestra cuenta de google y comenzamos a trabajar con una interfaz muy visual “pipes” –”tuberías”, en eso consistirá nuestro proceso .

Comenzamos accediendo a los recursos del frame izquierdo (SOURCES). Aquí escogemos “Fetch Feed” lo arrastramos al centro de la pantalla, en esa caja vamos añadiendo las direcciones de los feeds a tratar vemos en el frame inferior como nos aparece los “ítems” extraídos de esos feeds, podríamos añadir en cada caja 10 URLs , podríamos añadir mas cajas “Fetch Feeds” para el resto de URLs que tuviéramos .

Segundo paso accederíamos de nuevo al frame izquierdo, escogemos en “Operators ” y escogemos “Filter” ahí pondremos los criterios por los cuales vamos a filtrar nuestro feed.

A partir de los filtros a aplicar, unimos mediante “pipes“, podríamos unir varias cajas “Fetch Feed” a través del operador “Union” , aplicando la lógica podremos obtener todos los resultados deseados, a través de “Pipe Union”. Guardamos nuestro pipe y ya podremos acceder a él para obtener los resultados mediante un feed personalizado.

Ya en este punto nos queda tan solo obtener la dirección de nuestro pipe para incrustarla o usarla como fuente de vigilancia.

http://pipes.yahoo.com/pipes/person.info?_out=rss&display=pipes&guid=M6OQQUVBDSHCJYUNE6SZJXZY6I

Poner en valor dicha información:

  • Imprimiendo dicho feed
    • Podríamos pasarlo a PDF y así imprimirlo, a través por ejemplo de: http://rss2pdf.com/ desde esta web insertamos la dirección de nuestro feed y obtendríamos un pdf para imprimir o enviar por mail
  • Agregándolo al navegador o al correo como fuente RSS. Trabajando a través del google Crome y una de sus extensiones “Slick RSS”. Instalamos dicha extensión

Y en su apartado de opciones vamos a Export Feeds

Ya tenemos el código para importar desde otro tipo de plataformas En internet Explorer

Copiamos el código al portapapales y en un txt lo guardamos con extensión .opml, para así hacerlo importable desde office.

  • En Outlook el proceso seria el siguiente:

Inicio –Fuente RSS-Importar un archivo OPML

Ya tendríamos de esta manera nuestro “pipe” implementado en nuestro correo, recibiendo las actualizaciones periódicamente.

En Outlook Express: En Este gestor se hace necesaria una extensión RSS Popper http://www.paradisoft.com/rsspopper/download.asp

Una vez instalada la extensión ya vemos que nuestra barra ha variado en algo nos vamos a Edit Feed . Nos aparecerán por defecto una serie de Feeds a rastrear (los eliminaremos para evitar basura) e importar nuestro archivo .opml. Ya nos aparecerá en nuestro correo

En Internet Explorer. realizaremos una importación de nuestro archivo opml. Archivo -Importar –Fuentes- escogeremos la ruta de nuestro archivo. Nos aparecerá nuestro feed en fuentes.

Anuncios
Esta entrada fue publicada en Informatica y etiquetada , , , , . Guarda el enlace permanente.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s