Tecnologías de modelado, procesamiento y gestión del

Preview:

Citation preview

Tecnologías de modelado,

procesamiento y gestión del conocimiento  

Quiénes somos

•  Miembros  principales  –  Rodrigo  Mar2nez  Béjar  (rodrigo@um.es)  –  Jesualdo  Tomás  Fernández  Breis  (jfernand@um.es)  –  Rafael  Valencia  García  (valencia@um.es)  –  Francisco  García  Sánchez  (frgarcia@um.es)  –  Marcos  Menárguez  Tortosa  (marcos@um.es)  

•  Aprox  10  estudiantes  de  doctorado  y  10  proyectos/contratos  de  invesNgación  en  marcha  

•  Histórico:  aprox.  30  tesis  doctorales  

•  Miembros  del  InsNtuto  Murciano  de  InvesNgación  Biosanitaria  (IMIB-­‐Arrixaca)  

Web semántica (Berners-Lee 2001)

Que las máquinas entiendan el significado de los datos

Linked Data (Berners-Lee, 2006)

Estandarización semántica

Data  schemas   Data  

Schema  mapping  

Mapping  file,  idenNty  

condiNons  

Ontology  

Data  transformaNon  

RDF  data  

Linked  Data  sets  

Linked  dataset  

Data  enrichment  

Enriquecimiento de ontologías (tesis doctoral 3 de diciembre)

Class  `Alcohol  Binding´  before  the  applicaNon  of  the  enrichment.  

Class  `Alcohol  Binding´  a3er  the  applicaNon  of  the  enrichment.  

Calidad de ontologías (tesis doctoral 21 de enero)

•  Existen  más  de  400  ontologías  ¿cómo  saber  cuáles  Nenen  un  mínimo  de  calidad?  

7. PUBLICACIONES QUE COMPONEN ESTA TESIS

all of the ontologies, which can be accessed at http://miuras.inf.um.es/oquarewiki.

Analysis of the effect of the GoodOD guideline over thequality of the ontologies developedTo analyse the training effect over the ontologies developed by

the students, a training by topic two-way ANOVA model withinteraction term and balanced design for everyone of the 29evaluated subcharacteristics was applied. The 216 observationsfrom 24 untrained and trained students, corresponding to 36ontologies for each of the six topics (PRO, CLO, IMM, INF, CME

and SPA) were reused. This analysis showed that there is asignificant effect of the interaction training by topic for 22OQuaRE subcharacteristics (.000,p–value,0.03) (Figure 2).This means that the effect of the training could be differentdepending on the topic for those 22 selected subcharacteristics. Forthe other seven subcharacteristics there is no effect of theinteraction training by topic, neither by topic neither by training(see Table 3 and Figure 3).Figure 3 represents the mean values of the subcharacteristics by

topic, for untrained students, trained students and the goldstandard. The graph shows that the seven subcharacteristics with

Figure 2. Significant effect of training in some topics. 22 subcharacteristics presented significant effect due to the GoodOD based training forsome topics (PRO, IMM, CLO, CME, INF, SPA).doi:10.1371/journal.pone.0104463.g002

Table 3. P-values associated with the main effects in the two-way ANOVA with no effect of the interaction training by topic.

Sub-characteristic Trained Topic Trained X Topic

Reference Ontology 0.318 0.418 0.418

Text Analysis 0.318 0.418 0.418

Knowledge Reuse 0.586 0.069 0.952

Infering 0.318 0.418 0.418

Formalisation 0.318 0.418 0.418

Formal Relation Support 0.318 0.418 0.418

Consistency 0.318 0.418 0.418

doi:10.1371/journal.pone.0104463.t003

Evaluating GoodOD with OQuaRE

PLOS ONE | www.plosone.org 6 August 2014 | Volume 9 | Issue 8 | e104463

112

Anotación semántica de textos Semantic annotation

32!"

Ontology Population

39

Buscadores semánticos

36

Recomendación semántico-social Recommender systems

4

Item Score

I1 1

I2 0,3

i3 0,8

Recommender system

Recommendation list

User preferences

Community data

Items information

Knowledge models

Planificación y recomendación financiera

• nn

Minería de opiniones y detección de tendencias

•  Análisis  del  contenido  de  tweets  

!"#"$$%&'()"(#"')"'$%*+("'(,-%##".( ( /.*)0("'(1'2"'%".3*(1'40.56#%$*(

!"#$$%&'()*+',-."#&*( ( 78(

90'+:;#*.( ;0+( <0.$"'#*="+( >( '?5".0( )"( @*;0.*$%0'"+( )"( $*)*( <0;*.%)*)( *+%2'*)*+(

*:#056#%$*5"'#"(<0.(";(+%+#"5*("'(#0)0(";(+%+#"5*A(

90'+:;#*.(;*+(#"')"'$%*+(*$#:*;"+("'(,-%##".()"#"$#*)*+(<0.(";(+%+#"5*A(

90'+:;#*.( ;0+( :+:*.%0+( 56+( 5"'$%0'*)0+( "'( ;0+( #:%#+( >( ;0+( :+:*.%0+( B:"( 56+( #:%#+(

<:C;%$*'("'(,-%##".A((

90'+:;#*.(;*+(<*;*C.*+(56+(%5<0.#*'#"+(:#%;%D*)*+(<0.(;0+(:+:*.%0+()"(,-%##".A(

90'+:;#*.(;0+(#:%#+(56+(."#-%##"*)0+("'(,-%##".A(

E"*;%D*.(:'*(C?+B:")*(50'0F#G.5%'0H(:+:*.%0I(J*+J#*2(0(<*;*C.*('0.5*;("'(#0)0+(;0+(

#:%#+(*;5*$"'*)0+("'(";(+%+#"5*A(

!"#"$ %&'()*+,*-./'01()*+,*2.3-,/()4,'*5*/67,3.*+,*8)1.3)-&./,'*+,*-)+)*2.1)3&+)+**(

K+( ;*( @%+#*( <.%'$%<*;( )"( ;*( *<;%$*$%&'(-"CA( K+#*( @%+#*(5:"+#.*( *;( :+:*.%0( ;0+( <0.$"'#*="+( >( ";(

'?5".0()"(@*;0.*$%0'"+()"($*)*(<0;*.%)*)(*+%2'*)*+(*:#056#%$*5"'#"(<0.(";(+%+#"5*("'(#0)0(

";(+%+#"5*(L@".(M%2:.*(NOPA(

(!"#$%&'()*'+&',"-.&'/%"01"/&2'

(

(!"#$%&'34*'5"-.&'67'.706701"&-'

(

(

!"#"9 %&'()*+,*-./'01()*+,*(,/+,/-&)'*(

K+(;*(@%+#*(<*.*($0'+:;#*.(;*+(#"')"'$%*+(*$#:*;"+("'(,-%##".()"#"$#*)*+(<0.(";(+%+#"5*A(Q*(@%+#*(

5:"+#.*( <0.( )"4"$#0( RS( #"')"'$%*+( 0.)"'*)*+( )"( 5*>0.( *( 5"'0.( %5<0.#*'$%*( >( <".5%#"(

!"#"$$%&'()"(#"')"'$%*+("'(,-%##".( ( /.*)0("'(1'2"'%".3*(1'40.56#%$*(

!"#$$%&'()*+',-."#&*( ( 78(

*)"56+($*59%*.(":(';5".0()"(#"')"'$%*+(50+#.*)*+(<=".(>%2?.*(@ABC(D)"56+(+"(E?")"(F*$".(?'( $:%$( +09."( ?'*( #"')"'$%*( )"( :*( :%+#*( )"( #"')"'$%*+(50+#.*)*( E*.*( 09#"'".( ?'*( =%+#*( G?"($0'#%"'"( :0+( 7A( ;:#%50+( #?%#+( G?"( $0'#%"'"'( ":( F*+F#*2( H( :0+( E0.$"'#*I"+( H( ';5".0( )"( #?%#+(E0+%#%=0+J('"2*#%=0+(H('"?#.0+("'(#0)0(":(+%+#"5*(G?"($0'#%"'"'(":(F*+F#*2(+":"$$%0'*)0(<=".(>%2?.*(@K(H(>%2?.*(@@BC(((

(

!"#$%&'()*'+,-&./,-"0&,'.1'2&34%&0"451,'.1'$5&'-15.150"&'

(

!"#$%&'((*'6$1,-%&'.1'-$"-,'.45.1'&7&%101'$5&'-15.150"&'

(

!"#"# $%&'()*+),-.&/0'()*+)0-&)/&/(1%-&)23&)(,'%4-&)+.)56%''+1)( •  Clasificación  de  tweets  por  

la  polaridad  de  su  contenido:  posiNvo,  negaNvo,  neutro  

Historia clínica electrónica

Historia clínica electrónica

Interoperabilidad  semánNca.    “Traducción”  de  datos  y  modelos  clínicos  

Colaboración con Programa de Prevención de Cáncer de Colon y Recto

Formalizar  los  protocolos  de  clasificación  de  

pacientes  por  nivel  de  riesgo    

Aplicación  automá?ca  a  la  base  de  datos  de  

pacientes  

Estudio  de  discrepancias,  modelos  

predic?vos  

Inteligencia de negocio clínica semántica (tesis doctoral 22 de diciembre)

•  Heterogeneidad  de  información  (p.e.,  registros  de  cáncer)  •  Desde  la  recogida  de  datos  hasta  cuadros  de  mando  

personalizados  con  tecnología  100%  semánNca  •  Varios  sistemas  en  producción  en  Hospital  Virgen  de  la  Arrixaca  

           

Estudio de regiones del cerebro (Premio mejor TFM Bioinformática 14-15)

¿La  regionalización  tradicional  del  cerebro  sigue  siendo  válida?  

Otras líneas en estado inicial

•  Análisis  basado  en  técnicas  de  RNA-­‐Seq  de  genes  implicados  en  procesos  relacionados  con  implantación  embrionaria    

•  Historia  clínica  electrónica  genómica  

•  Modelos  de  análisis  de  información  y  conocimiento  genéNco  y  genómico  para  el  estudio  de  cánceres  

•  ERP  semánNco  

           

Colaboradores

•  Universidades y Centros de Investigación: –  Europa: Reino Unido (Manchester, UCL, Liverpool), Alemania

(Friburgo, Institute of Medical Biometry and Medical Informatics), Austria (Graz), Francia (IRIT, LABRI), Italia (La Sapienza, Udine), Noruega (NTNU, Osfold)

–  No Europa: Australia (UNSW, Wollongong), Brazil (Sao Paulo, Portoalegre, Minas Gerais), Venezuela (Mérida), Cuba (Holguín), México (Aguascalientes, Sonora, Veracruz), Canadá (Carleton), China (Jilin), EEUU (Stanford), National Institute of Basic Biology (Japón)

–  España: UPV, UPM, UC3M, CBGP, UJI, Oviedo, Centro de Regulación Genómica

Colaboradores

•  Empresas: –  Grandes empresas: Indra, Atos Origin –  PYME: Aquiline Computer, Global Metanoia, Innopole, NETEX

Knowledge Factory, Quality Objects, Edosoft factory, ERS, Base Compañía de Soporte Lógico, Veratech for Health

–  Empresas surgidas del grupo: IMET, Vocali Sistemas Inteligentes

•  Entidades sanitarias •  Mayo Clinic (USA) •  Hospital Universitario Virgen de la Arrixaca •  FFIS •  Amsterdam Medical Center (Holanda)

Tecnologías de modelado,

procesamiento y gestión del conocimiento  

Recommended