View
64
Download
2
Category
Preview:
DESCRIPTION
MediaWiki
Citation preview
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
“Jacathon: Hack the Pyrenees”
David Portolés RodríguezIdearium Consultores
Formación en Mediawiki para acceso a AragoPedia
1
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Índice
Motivación
Descripción
Wikimedia y Wikidata.org
Diferencias con Wikipedia
Contenidos
Metodología de carga y presentación de la información
Acceso vía portal
Acceso vía API
Ejercicios tipo
2
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Motivación
3
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Motivación
4
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Descripción
5
Basada en MediaWiki:
Web colaborativa.
Sw libre de WikiMedia Foundation.
Incluye un API de acceso a contenidos.
Extracción de contenidos: AragoDBPedia.
• Tripletas semánticas
• Sujeto – predicado – objeto
Uso masivo del concepto de infobox:
• Info estructurada, no texto libre.
AragoPedia dispone de:
768 artículos (731 municipios + 33
comarcas + 3 provincias + Aragón)
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Wikimedia y wikidata.org
6
Wikimedia es una fundación para:
• Facultar y animar a la gente de todo el mundo a reunir y desarrollar contenido educativo neutral.
• Bajo una licencia de contenido libre o en el dominio público.
• Difundirla de manera efectiva y global.
Wikipedia (proyecto estrella, pero no único): uno de los diez sitios web más visitados del mundo.
Existe un activo chapter español: Wikimedia España (Wiki Loves Monuments...).
Wikidata:
• Base de datos estructurados y enlazados.
• Libre uso, permite reutilización.
• Multilingüe.
• Fuente de otros proyectos de Wikimedia.
• Posible fuente adicional de información para tus desarrollos.
¡Puedes colaborar!
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Diferencias con Wikipedia
7
AragoPedia no es, por el momento, colaborativa.
La información de AragoPedia está casi al 100% estructurada:
• Criterios homogéneos de estructuración en infoboxes.
• No hay apenas texto libre.
• Estructuración obligatoria en secciones.
Casi toda la apariencia de AragoPedia se basa en plantillas (templates):
• Imagen homogénea y coherente.
• Comprensible por un humano.
AragoPedia tiene una temática reducida (sólo hay 768 páginas por ahora).
La información de AragoPedia es 100% oficial.
AragoPedia aspira a completar Wikipedia, no a competir contra ella.
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Contenido interno (infoboxes)
8
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Ejemplo de página
9
Se busca lograr apariencia agradable al usuario humano: gráficas, textos, tablas...
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Metodología
10
{{Ficha de datos turisticos
| EST_HOTEL_MUNICIPIOS_2011 = 18
| PLAZAS_HOTEL_MUNICIPIOS_2011 = 871
| EST_CAMPINGS_MUNICIPIOS_2011 = 2
| PLAZAS_CAMPINGS_MUNICIPIOS_2011 = 1263
| EST_TURISMO_RURAL_MUNICIPIOS_2011 = 9
| PLAZAS_TURISMO_RURAL_MUNICIPIOS_2011 = 59
| EST_APARTAMENTOS_MUNICIPIOS_2011 = 4
| PLAZAS_APARTAMENTOS_MUNICIPIOS_2011 = 57
}}
…
{{#pPie: exploded|3d|legend|size=400x200|title=Plazas alojamiento turístico (2011)|data=Hoteles,{{{PLAZAS_HOTEL_MUNICIPIOS_2011|{{{PLAZAS_HOTEL_COMARCAS_2011|{{{PLAZAS_HOTEL_PROVINCIA_2011|{{{PLAZAS_HOTEL_ARAGON_2011|-}}}}}}}}}}}}Turismo rural,{{{PLAZAS_TURISMO_RURAL_MUNICIPIOS_2011|{{{PLAZAS_TURISMO_RURAL_COMARCAS_2011|{{{PLAZAS_TURISMO_RURAL_PROVINCIA_2011|{{{PLAZAS_TURISMO_RURAL_ARAGON_2011|-}}}}}}}}}}}}Campings,{{{PLAZAS_CAMPINGS_MUNICIPIOS_2011|{{{PLAZAS_CAMPINGS_COMARCAS_2011|{{{PLAZAS_CAMPINGS_PROVINCIA_2011|{{{PLAZAS_CAMPINGS_ARAGON_2011|-}}}}}}}}}}}}}}
DATOS
PLANTILLA
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Algunos de sus contenidos (1)
11
Municipios:
o Datos de administración local.
o Padrón municipal y censo de población.
o Datos de reciclaje:• "Recogida de vidrio: kilogramos y número de contenedores, por municipios y provincias. Aragón. Años
1997-2012.", (IAEST).
o Información turística:• “Oferta de alojamiento turístico. Aragón y provincias”, (IAEST).
o Usos del suelo:• “CORINE Land Cover”, (IAEST).
o Además:
Mapa de situación obtenido de WMS de SITAR.
Información urbanística publicada en SIUa.
Toponimia publicada en SITAR.
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Algunos de sus contenidos (2)
12
Comarcas:
o Datos de administración local.
o Padrón municipal y censo de población.
o Información turística:• “Oferta de alojamiento turístico. Aragón y provincias”, (IAEST).
o Además:
Mapa de situación obtenido de WMS de SITAR.
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Algunos de sus contenidos (y 3)
13
Provincias:
o Datos de reciclaje:• "Recogida de vidrio: kilogramos y número de contenedores, por municipios y provincias. Aragón. Años
1997-2012.", (IAEST).
o Consumo de carburante:• “Consumo de productos petrolíferos”, (IAEST).
o Información turística:• “Oferta de alojamiento turístico. Aragón y provincias”, (IAEST).
Aragón:
o Padrón municipal.
o Datos de reciclaje:• "Recogida de vidrio: kilogramos y número de contenedores, por municipios y provincias. Aragón. Años
1997-2012.", (IAEST).
o Consumo de carburante:• “Consumo de productos petrolíferos”, (IAEST).
o Información turística:• “Oferta de alojamiento turístico. Aragón y provincias”, (IAEST).
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Acceso al contenido vía portal
14
Código interno: opción VER FUENTE
Desde VER FUENTE, acceso a plantillas:http://opendata.aragon.es/aragopedia/index.php/Plantilla:Ficha_de_localidad_de_Espa%C3%B1a
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Acceso al listados vía API
15
Listado de páginas existentes:o Obtener la lista de artículos publicados en formato HTML (limite máximo de primeros 500
resultados, informando de que hay más resultados, empezando por el siguiente valor a obtener Orera):
http://opendata.aragon.es/aragopedia/api.php?action=query&list=allpages&aplimit=500
o Obtener la lista de artículos publicados a partir del valor Orera (para superar el máximo de primeros 500 resultados):
http://opendata.aragon.es/aragopedia/api.php?action=query&list=allpages&aplimit=500&apfrom=Orera
o Obtener la lista de artículos publicados en formato JSON:
http://opendata.aragon.es/aragopedia/api.php?action=query&list=allpages&aplimit=500&format=json
o Obtener la lista de artículos publicados en formato XML:
http://opendata.aragon.es/aragopedia/api.php?action=query&list=allpages&aplimit=500&format=xml
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Acceso al contenido vía API
16
Contenido del artículo en formato wiki-text (equivalente a VER FUENTE):http://opendata.aragon.es/aragopedia/index.php?action=raw&title=Jaca
Obtener el contenido interno de la página de Jaca en formato XML (infoboxes a partir de los cuales se construye la página):
http://opendata.aragon.es/aragopedia/api.php?action=query&prop=revisions&rvprop=content&titles=Jaca&format=xml
Obtener el contenido generado de la página de Jaca en formato XML:http://opendata.aragon.es/aragopedia/api.php?action=parse&page=Jaca&format=xml
Obtener las secciones de la página de Jaca en formato XML:
http://opendata.aragon.es/aragopedia/api.php?action=parse&page=Jaca&format=xml&prop=sections
Obtener el contenido de las sección 2 de la página de Jaca: http://opendata.aragon.es/aragopedia/api.php?action=query&titles=Jaca&prop=revisions&rvprop=content&rvsection=2
Varias páginas en formato JSON, XML o TXT:http://opendata.aragon.es/aragopedia/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=Jaca|Benasque&format=xml
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Búsquedas vía API
17
Realizar la búsqueda de la palabra Rodriguez en todas las páginas (con máximo de 20 resultados):
http://opendata.aragon.es/aragopedia/api.php?action=query&list=search&srwhat=text&srsearch=Rodriguez&format=xml&srlimit=20
Realizar la búsqueda de la palabra Rodriguez en todas las páginas a partir del resultado 25, con 20 resultados máximo:
http://opendata.aragon.es/aragopedia/api.php?action=query&list=search&srwhat=text&srsearch=Rodriguez&format=xml&sroffset=25&srlimit=20
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Exportación vía API
18
Exportación de contenidos en XML (permite la carga en otras instancias de Mediawiki):
http://opendata.aragon.es/api.php?action=query&export&exportnowrap&titles=Panticosa|Benasque
Además se ofrece un dump completo:
http://opendata.aragon.es/aragopedia/dumps
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Otra información vía API
19
Metadatos de la página:
http://opendata.aragon.es/aragopedia/api.php?action=query&prop=info&titles=Jaca&format=xml
Enlaces a otras páginas:
http://opendata.aragon.es/aragopedia/api.php?action=query&generator=links&prop=revisions&titles=Jaca
Imágenes incluidas en la página:
http://opendata.aragon.es/aragopedia/api.php?action=query&prop=images&titles=Jaca
Enlaces inversos:
http://opendata.aragon.es/aragopedia/api.php?action=query&list=backlinks&bltitle=La_Ribagorza
Utilidades para uso del API en distintos entornos: http://www.mediawiki.org/wiki/API:Client_code
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
?David Portolés Rodríguez
dportoles@idearium-consultores.com
20
“Jacathon: Hack the Pyrenees”
Formación en Mediawiki para acceso a AragoPedia
Formación en Mediawiki, Jaca, 26 de septiembre de 2014
Ejercicios tipo
21
Acceso al contenido de la página de la provincia de Zaragoza en HTML y XML.
Comprobar la lista de secciones de La Ribagorza, provincia de Huesca y Aragón. Ver cuáles son compartidas y cuáles no.
Obtener la lista de secciones de Veracruz. ¿es igual que el resto de municipios?
Reflexión: ¿Qué datos podrían ser de más interés incorporar en AragoPedia? ¿Qué nuevas páginas deberían incorporarse?
¿En cuántos documentos aparece la palabra “torres”? ¿se hace búsqueda exacta?
Ver el resultado al incluir a la anterior srprop=snippet|score
Si sobra tiempo:
Obtener la lista de páginas y ver si son 768. En caso de que haya más, detectar cuales son las extra.
Descargar todos los documentos en ficheros XML independientes.
Recommended