50
Reordenació i agrupament d’imatges resultants d’una cerca de vídeo Mónica Alfaro Vendrell Tutors: Xavier Giró (UPC) Xavier Vives (CCMA)

Reordenació i agrupament d'imatges d'una cerca de vídeo

Embed Size (px)

DESCRIPTION

Defensa del Project de Final de Carrera de la Mónica Alfaro, en els estudis d'Engineria Tècnica en Telecomunicacions, especialitat en So i Imatge. Co-dirigit per en Xavier Giró-i-i-Nieto (UPC) i Xavier Vives (CCMA) Escola d'Enginyeria de Terrassa, Universitat Politècnica de Catalunya. Gener 2011. Més detalls: https://imatge.upc.edu/web/publications/reordenacio-i-agrupament-dimatges-duna-cerca-de-video

Citation preview

Page 1: Reordenació i agrupament d'imatges d'una cerca de vídeo

Reordenació i agrupament d’imatges

resultants d’una cerca de vídeo

Mónica Alfaro Vendrell

Tutors:

Xavier Giró (UPC)

Xavier Vives (CCMA)

Page 2: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Escenari

» del volum dels repositoris

» Cerques eficients

Repositori

2

Page 3: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Proposta: tècniques de reordenació i agrupament

3

Eclipse

Page 4: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motors de reordenació i agrupament

• Motor de reordenació

• Motor d’agrupament

• Client web

• Desenvolupament

• Entorn de desenvolupament

• Conclusions

• Treball realitzat

• Assoliment dels requeriments

• Treball futur

UPC

CCMA

4

Page 5: Reordenació i agrupament d'imatges d'una cerca de vídeo

UPC

5

Page 6: Reordenació i agrupament d'imatges d'una cerca de vídeo

UPC

6

•Motors de reordenació i agrupament

•Motor de reordenació

•Motor d’agrupament

•Client web

•Desenvolupament

•Entorn de desenvolupament

•Conclusions

•Treball realitzat

•Assoliment dels requeriments

•Treball futur

Page 7: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Els continguts audiovisuals

s’emmagatzemen formant

assets

• Els keyframes són imatges claus

que s’extreuen del vídeo

• Metadades:

• Caràcter general: a nivell d’asset

• Estrats: segments temporals del vídeo

7

Page 8: Reordenació i agrupament d'imatges d'una cerca de vídeo

Mo

ntilla

En

tre

vis

ta

Tele

no

tíc

ies

Mo

ntilla

• Anotacions textuals a nivell d’asset.

Reordenació

8

Page 9: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Reptes que es plantegen:

» Prioritzar els keyframes rellevants

» Mostrar diversitat d’assets

Montilla

Reordenació

9

Page 10: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Rellevància similar Vídeos similars

• No requereix un llistat inicial ordenat

• Basats en:

Reordenació

Pseudo-retroacció de

rellevància

Similitud

10

Page 11: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

11

Page 12: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Importància d’un keyframe Número de keyframes semblants

Pas 1 Graf de similitud

Reordenació

node =

imatge

aresta = similitud visual

0.8

0.7

1.0

0.6

distancia

visual

Graf de similitud

12

Page 13: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Solució final:

» Distància visual mínima per cada descriptor visual:

» Número màxim d’arestes per node

Pas 1 Graf de similitud

Reordenació

Descriptor visual Distancia mínima

Color layout 0.7

Color dominant 0.7

Color structure 0.5

Texture edge histogram 0.7

13

Page 14: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

4 grafs de

similitud visual

14

Page 15: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Evitar la influència dels assets

Pas 2 Filtrat

Reordenació

Resultat:

NOU

15

Page 16: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Evitar keyframes similars del mateix asset

Pas 2 Filtrat

Reordenació

Resultat:

NOU

16

Page 17: Reordenació i agrupament d'imatges d'una cerca de vídeo

Les imatges d’un mateix asset no es poden enllaçar entre elles.

Filtrat intra-asset

Pas 2 Filtrat

Reordenació

NOU

17

Page 18: Reordenació i agrupament d'imatges d'una cerca de vídeo

Limitació a 1 aresta (màx. similitud) entre cada imatge i un altre

asset.

Filtrat inter-asset

Pas 2 Filtrat

w1

w2

w3

w 1 < w2 < w3

Reordenació

NOU

18

Page 19: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

4 grafs de

similitud visual

4 grafs de similitud

visual filtrats

19

Page 20: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Assigna puntuacions als keyframes basant-se en:

» Número de arestes

» Pes de cada aresta

Pas 3 Passejada aleatòria

a: factor de pes de cada expressió

Reordenació

20

Page 21: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

4 grafs de

similitud visual

4 grafs de similitud

visual filtrats

4 llistes

reordenades

21

Page 22: Reordenació i agrupament d'imatges d'una cerca de vídeo

Pas 4 Fusió de probabilitats

Reordenació

Fusió de

probabilitats

Fusió de distàncies

visuals

NOU

44332211 ····)( PPPPkeyframePuntuació

22

Page 23: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

4 grafs de

similitud visual

4 grafs de similitud

visual filtrats

4 llistes reordenades

1 llista final

23

Page 24: Reordenació i agrupament d'imatges d'una cerca de vídeo

Reordenació

• Consultes seleccionades:

• Estudi de la influència dels modes de filtratge: intra-asset, inter-asset,

intra&inter-asset, baseline.

• Avaluació:

» Rellevància dels keyframes Average precision

» Diversitat d’assets. Average asset diversity

Consulta #assets #KFs

Tennis de taula 3 1.116

Formula 1 6 3.441

Parlament 12 2.841

Accident 8 66

Futbol 16 416

24

Page 25: Reordenació i agrupament d'imatges d'una cerca de vídeo

αε

Reordenació

• Resultat general

Estudi de la rellevància Estudi de la diversitat

Baseline Sense Filtrat Intra-asset Inter-asset Intra&Inter-asset

25

Page 26: Reordenació i agrupament d'imatges d'una cerca de vídeo

UPC

26

•Motors de reordenació i agrupament

•Motor de reordenació

•Motor d’agrupament

•Client web

•Desenvolupament

•Entorn de desenvolupament

•Conclusions

•Treball realitzat

•Assoliment dels requeriments

•Treball futur

Page 27: Reordenació i agrupament d'imatges d'una cerca de vídeo

αε

Agrupament

• Definir grups de keyframes visualment semblants a nivell d’asset.

Asset A

Grup 1 Grup 2

Keyframes representants

27

Page 28: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Famílies:

» Supervisat: requereix el número de grups finals

» No supervisat: no requereix el coneixement previ del número de grups

• Tècniques:

Agrupament

Supervisat Càlcul Nous centroides

K-Means

Canopy

Quality Threshold

28

Page 29: Reordenació i agrupament d'imatges d'una cerca de vídeo

αε

Agrupament

• Esquema general

QualityThreshold

2

Keyframe 1 0.9

Keyframe 2 0.8

Keyframe 3 0.7

Keyframe 4 0.6

Keyframe 5 0.5

Keyframe 6 0.4

Keyframe 7 0.3

Keyframe 8 0.2Keyframe 9 0.1

Grafs de similitud pre-

calculats

Graf de similitud truncat i

fusionat

1

Grup 1 0.9Grup 2 0.8Grup 3 0.7Grup 4 0.6Grup 4 0.5Grup 5 0.4Grup 7 0.3Grup 8 0.2Grup 9 0.1

Keyframe 1 0.9

Keyframe 2 0.8

Keyframe 3 0.7

Keyframe 5 0.5

Keyframe 6 0.4

Keyframe 7 0.3

Keyframe 9 0.1

Resultats

Dins del grup

Per cada asset

• Paràmetres:

» Valor màxim del radi dels grups

» Mínim número de resultats

» Valor de la puntuació final del grup

29

Page 30: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motors de reordenació i agrupament

• Motor de reordenació

• Motor d’agrupament

• Client web

• Desenvolupament

• Entorn de desenvolupament

• Conclusions

• Treball realitzat

• Assoliment dels requeriments

• Treball futur

UPC

CCMA

30

Page 31: Reordenació i agrupament d'imatges d'una cerca de vídeo

CCMA

31

Page 32: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Incorporar les tècniques de reordenació i agrupament

• Integració de l’eina dins del Digition

32

Page 33: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Digition

33

Page 34: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Google Swirl

34

Page 35: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Google Swirl

35

Page 36: Reordenació i agrupament d'imatges d'una cerca de vídeo

• iGroup

36

Page 37: Reordenació i agrupament d'imatges d'una cerca de vídeo

37

Page 38: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Estructura client-servidor

• Comunicació entre els clients i els servidors: protocol HTTP

• Arquitectura REST pels servidors.

Servidor CCMA

Servidor UPC

Client 1

Client 2

Client 3

38

Page 39: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motors de reordenació i agrupament

• Motor de reordenació

• Motor d’agrupament

• Client web

• Desenvolupament

• Entorn de desenvolupament

• Conclusions

• Treball realitzat

• Assoliment dels requeriments

• Treball futur

UPC

CCMA

39

Page 40: Reordenació i agrupament d'imatges d'una cerca de vídeo

40

Page 41: Reordenació i agrupament d'imatges d'una cerca de vídeo

UPC CCMA

• JAMA• JFreeChart

41

Page 42: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motors de reordenació i agrupament

• Motor de reordenació

• Motor d’agrupament

• Client web

• Desenvolupament

• Entorn de desenvolupament

• Conclusions

• Treball realitzat

• Assoliment dels requeriments

• Treball futur

UPC

CCMA

42

Page 43: Reordenació i agrupament d'imatges d'una cerca de vídeo

43

Page 44: Reordenació i agrupament d'imatges d'una cerca de vídeo

Reordenador Agrupador

Servei web upseek

Servidor CCMA

Comunicacions

Interfície gràfica d’usuari

Disseny i implementació

Disseny

Disseny i implementació per

part d’altres membres

44

Page 45: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motor de reordenació i agrupament

» El pas de filtrat és una tècnica vàlida

» Comunicació per ICMR 2011

• Client

» Interfície gràfica integra els algoritmes

» No rep resultats del servidor

45

Page 46: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Reordenació Agrupament

• Creació de grafs de similitud textual

UPC

• Integració del servei web

• Integració del client al Digition

CCMA

46

Page 47: Reordenació i agrupament d'imatges d'una cerca de vídeo
Page 48: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Average Precision:

• on m és el número de documents rellevants

• Precisió:

Avaluació de la rellevància

m

kkecision

mecisionAverage

1)(Pr

1Pr

48

1

2

3

4

5

6

1

1)1(P2

1)2(P3

2)3(P

73.0)3

2

2

1

1

1(

3

1AP

recuepratstotalsdocuments

recuperatsrellevantsdocumentsP

Page 49: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Average Asset-Diversity:

• on m és el número total d’assets diferents

• Asset-Diversity:

• on d(k) correspon al número d’assets diferent en les posicions 1...k

Avaluació de la diversitat

49

1

2

3

4

5

6

012

11)2(AD

39.0)3

2

2

10(

14

1AAD

m

kkAD

mAADdiversityAsset

2)(

1

1

1

1)()(

k

kdkADdiversityAsset

2

1

13

12)3(AD3

2

14

13)4(AD

Page 50: Reordenació i agrupament d'imatges d'una cerca de vídeo

αε

Reordenació

• Resultat desglossat per cada consulta:

Estudi de la rellevància Estudi de la diversitat

Baseline Sense Filtrat Intra-asset Inter-asset Intra&Inter-asset

50