23
Reproducció Reproducció d’accions en vídeo d’accions en vídeo Víctor Ponce López UNIVERSITAT DE BARCELONA

Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

Reproducció Reproducció ppd’accions en vídeod’accions en vídeo

Víctor Ponce López

UNIVERSITAT DE BARCELONA

Page 2: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

ÍNDEX

Motivació Proposta de sistema Estructura general planificació i costos Estructura general, planificació i costos Resultats Discussions i propostes futures Conclusions

2

Page 3: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

MOTIVACIÓ

Estudi de les aptituds socials de les persones [1]. Qualificar el comportament en actes de comunicació oral Qualificar el comportament en actes de comunicació oral

[2]:– Presentacions– Entrevistes de feina

Simplificar els elements externs:– No usar sensors.

___________________________________________________________________________________________

3[1] T. Allen, Charting a communicative pathway: Using assessment to guide curriculum development in arevitalized general education plan.. Communicative Education, 51(1) 26-39. 2002.[2] J. L. Winsor, D.B. Curtis, and R.D. Stephens. National preferences in business and communication education: A survey update. Journal of the association of Comunication Administration, Vlo. 3, pp. 170-179. 1997.

Page 4: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

PROPOSTA

Únicament es necessiten:– Ordinador– Càmera

Micròfon (opcional)– Micròfon (opcional)

Dos versions del sistema:– Anàlisis d’un fitxer d’audio-vídeo ( avi)Anàlisis d un fitxer d audio vídeo (.avi)– Anàlisis de la gravació directa per càmera (real-time)

Tecnologies principals:

4

g p p– OpenCV, speech features, Adaboost

Page 5: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

ESTRUCTURA GENERAL

5___________________________________________________________________________________________[1] A. Pentland, Socially aware computation and communication, Computer, volumen 38, páginas 33-40, 2005.___________________________________________________________________________________________[2] J. Friedman, T. Hastie and Robert Tibshirani, Additive Logistic Regression: a Statistical View of Boosting, Annals of Statistics, volumen 28, páginas 2000-2030, 1998.

Page 6: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

ESTRUCTURA GENERAL

Extracció d’audio

[1]

6 ___________________________________________________________________________________________[1] Speech features. http://groupmedia.media.mit.edu/data.php

Page 7: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

ESTRUCTURA GENERAL

Detecció Facial – Facedetect

• S’utilitzaran restriccions i comptadors per considerarbona una detecció i assegurar que només hi ha unasola cara vàlida

7sola cara vàlida.

___________________________________________________________________________________________[1] P. Viola and M. J. Jones, Robust Real-Time Face Detection, Int. J. Comput. Vision, volumen 57, número 2,páginas 137-154, 2004.

Page 8: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

ESTRUCTURA GENERAL

Es detecta el color de la pell seleccionant una porció de la cara

Segmentació

p pvàlida.

S’aconseguirà un espectre del model de color aproximadament d’aquest estil.aproximadament d aquest estil.

Amb el model de color es farà la segmentació aconseguint una imatge en escala de grisos.

8___________________________________________________________________________________________[1] M. Jones and J. Rehg, Statistical color models with application to skin detection, Intenational Journal of Computer Vision, volumen 46, páginas 81-96, 2002.

Page 9: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

ESTRUCTURA GENERAL

Seguiment - Algoritme

Erosió i morfologia

9 ___________________________________________________________________________________________[1] Blobs library of OpenCV. http://opencv.willowgarage.com/wiki/cvblobsLib

Page 10: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

ESTRUCTURA GENERAL

Descriptors

10 ___________________________________________________________________________________________[1] A. Pentland, Socially aware computation and communication, Computer, volumen 38, páginas 33-40, 2005.

Page 11: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

Diagrama de flux

ESTRUCTURA GENERAL

11

Page 12: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

PLANIFICACIÓ

12

Page 13: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

COSTOS

13

Page 14: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

RESULTATS

Gravació de 30 vídeos– 15 defenses de projectes

d fi dde fi de carrera– 15 projectes de Visió

artificial, 4t curs del Grau en Enginyeria informàticaR l ió 640 480 í l– Resolució 640x480 píxels, frame rate de 25 imatges per segon

• Experiment:- Validació del sistema- Classificació segons les qualificacions

14

g q- Classificació segons opinions d’observadors- Aplicacions d’innovació docent

Page 15: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

RESULTATS

15

Page 16: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

RESULTATS

Es mostren 2 vídeos amb diferents nivells d’agitació Es mostren 2 vídeos amb diferents nivells d agitació

poca_agitacion.avi mucha_agitacion.avi

16

Page 17: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

RESULTATS

Interfície – frontal

17

Page 18: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

RESULTATS

Interfície – no frontal

18

Page 19: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

RESULTATS

Classificació per qualificació Classificació observadors

• Validació creuada

19• Coincideixen 7 de les 8 característiques

Page 20: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

DISCUSSIÓ

Oclusions Il·luminació

• Punts pendents a millorar- Aspectes de segmentació

Seguiment més robust amb més gestió de les

20- Seguiment més robust amb més gestió de les

oclusions

Page 21: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

CONCLUSIONS

Eina informàtica per a l’anàlisi automàtic de la comunicació oral i gestual

– Valoració d’aptituds socials, en general– Valoració de presentacions, en particular

Classificació dels vídeos analitzats Classificació dels vídeos analitzats– S’ofereix un “feedback” per valorar els aspectes millorables

Projecte d’innovació docent 2009PID-UB/04.D t t d’ t t i i ti ió d l F lt t d– Departament d’aprenentatge i investigació de la Facultat de Matemàtiques, obtenint una Beca de Col·laboració

– Jornada universitària Jenui 2010. Santiago de CompostelaC ITACA U i it t A tò d B l

21– Campus ITACA. Universitat Autònoma de Barcelona

Page 22: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

PROPOSTES FUTURES

Descriptors estructurals– Estudi de les formes– Estudi de contorns

Tractar en paral·lel l’àudio i el vídeo Tractar en paral lel l àudio i el vídeo– Tenir aquesta informació en temps real

Treballar els casos conflictius discutitsA é t tè i j l Avançar més en aquesta competència, ja que la considero molt important per les persones al llarg de la seva vida

22

Page 23: Reproducció d’accions en vídeo - UBsergio/linked/victor2010.pdf · PROPOSTA Únicament es necessiten: – Ordinador – Càmera – Micròfon (opcional)Micròfon (opcional) Dos

GRÀCIES!

23