c# pdf reader text : Delete pages out of a pdf file control SDK system azure winforms wpf console SzeliskiBook_20100903_draft74-part652

14.6 Recognition databases and test sets
719
Name / URL
Extents
Contents/ Reference
Face and person recognition
Yale face database
Centeredface images
Frontal faces
http://www1.cs.columbia.edu/belhumeur/
Belhumeur,Hespanha, and Kriegman(1997)
Resourcesfor face detection
Various databases
Faces in various poses
http://vision.ai.uiuc.edu/mhyang/face-detection-survey.html
Yang, Kriegman,and Ahuja(2002)
FERET
Centeredface images
Frontal faces
http://www.frvt.org/FERET
Phillips,Moon, Rizviet al.(2000)
FRVT
Centeredface images
Faces in various poses
http://www.frvt.org/
Phillips,Scruggs, O’Tooleet al.(2010)
CMUPIE database
Centeredface image
Faces in various poses
http://www.ri.cmu.edu/projects/project
418.html
Sim, Baker,and Bsat(2003)
CMUMulti-PIE database
Centeredface image
Faces in various poses
http://multipie.org
Gross,Matthews,Cohn etal.(2010)
Faces in the Wild
Internet images
Faces in various poses
http://vis-www.cs.umass.edu/lfw/
Huang,Ramesh,Berg et al.(2007)
Consumer image person DB
Complete images
People
http://chenlab.ece.cornell.edu/people/Andy/GallagherDataset.html
Gallagherand Chen(2008)
Object recognition
Caltech 101
Segmentation masks
101 categories
http://www.vision.caltech.edu/Image
Datasets/Caltech101/
Fei-Fei,Fergus,and Perona(2006)
Caltech 256
Centeredobjects
256 categories and clutter
http://www.vision.caltech.edu/Image
Datasets/Caltech256/
Griffin,Holub,and Perona(2007)
COIL-100
Centeredobjects
100 instances
http://www1.cs.columbia.edu/CAVE/software/softlib/coil-100.php
Nene,Nayar,and Murase(1996)
ETH-80
Centeredobjects
8instances, 10 views
http://www.mis.tu-darmstadt.de/datasets
Leibeand Schiele(2003)
Instance recognition benchmark
Objects in various poses
2550 objects
http://vis.uky.edu/stewe/ukbench/
Nist´erand Stew´enius(2006)
Oxford buildings dataset
Pictures of buildings
5062 images
http://www.robots.ox.ac.uk/vgg/data/oxbuildings/
Philbin,Chum, Isard et al.(2007)
NORB
Bounding box
50 toys
http://www.cs.nyu.edu/ylclab/data/norb-v1.0/
LeCun, Huang,and Bottou(2004)
Tiny images
Complete images
75,000 (Wordnet) things
http://people.csail.mit.edu/torralba/tinyimages/
Torralba,Freeman,and Fergus(2008)
ImageNet
Complete images
14,000 (Wordnet) things
http://www.image-net.org/
Deng, Dong, Socheret al.(2009)
Table 14.1 Image databases for recognition, adapted and expanded fromFei-Fei,Fergus,
and Torralba(2009).
Delete pages out of a pdf file - remove PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Provides Users with Mature Document Manipulating Function for Deleting PDF Pages
best pdf editor delete pages; delete a page in a pdf file
Delete pages out of a pdf file - VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Visual Basic Sample Codes to Delete PDF Document Page in .NET
add or remove pages from pdf; delete a page from a pdf file
720
Computer Vision: Algorithms and Applications (September 3, 2010 draft)
Name / URL
Extents
Contents / Reference
Object detection / localization
CMUfrontal faces
Patches
Frontal faces
http://vasc.ri.cmu.edu/idb/html/face/frontal
images
Rowley,Baluja,and Kanade(1998a)
MIT frontal faces
Patches
Frontal faces
http://cbcl.mit.edu/software-datasets/FaceData2.html
Sung and Poggio(1998)
CMUface detection databases
Multiple faces
Faces in variousposes
http://www.ri.cmu.edu/research
project
detail.html?project
id=419
Schneiderman and Kanade(2004)
UIUC Image DB
Bounding boxes
Cars
http://l2r.cs.uiuc.edu/cogcomp/Data/Car/
Agarwal and Roth(2002)
Caltech Pedestrian Dataset
Bounding boxes
Pedestrians
http://www.vision.caltech.edu/Image
Datasets/CaltechPedestrians/
Doll
`
ar, Wojek,Schieleet al.(2009)
Graz-02 Database
Segmentation masks
Bikes, cars, people
http://www.emt.tugraz.at/pinz/data/GRAZ
02/
Opelt, Pinz, Fusseneggeret al.(2006)
ETHZ Toys
Cluttered images
Toys, boxes, magazines
http://www.vision.ee.ethz.ch/calvin/datasets.html
Ferrari,Tuytelaars, and Van Gool(2006b)
TU Darmstadt DB
Segmentation masks
Motorbikes, cars, cows
http://www.vision.ee.ethz.ch/bleibe/data/datasets.html
Leibe,Leonardis,and Schiele(2008)
MSR Cambridge
Segmentation masks
23 classes
http://research.microsoft.com/en-us/projects/objectclassrecognition/
Shotton,Winn,Rotheretal.(2009)
LabelMe dataset
Polygonal boundary
>500 categories
http://labelme.csail.mit.edu/
Russell,Torralba,Murphy etal.(2008)
LotusHill
Segmentation masks
Scenesand hierarchies
http://www.imageparsing.com/
Yao, Yang,Lin et al.(2010)
On-line annotation tools
ESP game
Image descriptions
Web images
http://www.gwap.com/gwap/
von Ahn and Dabbish(2004)
Peekaboom
Labeled regions
Web images
http://www.gwap.com/gwap/
von Ahn, Liu, and Blum(2006)
LabelMe
Polygonal boundary
High-resolution images
http://labelme.csail.mit.edu/
Russell,Torralba,Murphy etal.(2008)
Collections of challenges
PASCAL
Segmentation, boxes
Various
http://pascallin.ecs.soton.ac.uk/challenges/VOC/
Everingham, Van Gool,Williams et al.(2010)
Table 14.2 Image databases for detection and localization, adapted andexpandedfromFei-
Fei, Fergus, and Torralba(2009).
VB.NET PDF delete text library: delete, remove text from PDF file
Delete text from PDF file in preview without adobe PDF reader component installed. Able to pull text out of selected PDF page or all PDF document in .NET
delete pages on pdf; copy pages from pdf to new pdf
C# PDF delete text Library: delete, remove text from PDF file in
Able to pull text out of selected PDF page or all PDF option, The search and delete match rules. -. pageCount, The count of pages that will be deleted a string.
delete blank pages in pdf files; delete blank pages from pdf file
14.6 Recognition databases and test sets
721
airplane
bicycle
bird
boat
bottle
bus
car
cat
chair
cow
diningtable
dog
horse
motorbike
person
pottedplant
sheep
sofa
train
tvmonitor
Figure 14.54 Sample images from the PASCAL Visual Object Classes Challenge 2008
(VOC2008) database (Everingham,VanGool,Williamsetal.2008). The original images
were obtained from flickr (http://www.flickr.com/) and the database rights are explained on
http://pascallin.ecs.soton.ac.uk/challenges/VOC/voc2008/.
“serious” volunteer effort is the LabelMe database, in which vision researchers contribute
manual polygonal region annotations in return for gaining access to the database (Russell,
Torralba, Murphy et al. 2008).
The use of computer vision algorithms for collecting recognition databases dates back to
the work ofFergus,Fei-Fei,Peronaetal.(2005), who cluster the results returned by Google
image search using an extension of PLSA and then select the clusters associated with the
highest ranked results. More recent examples of related techniques include the work ofBerg
and Forsyth(2006)and Li and Fei-Fei(2010).
Whatever methods are used to collect and validate recognition databases, they will con-
tinue to grow in size, utility, and difficulty from year to year. They will also continue to be
an essential component of research into the recognition and scene understanding problems,
which remain, as always, the grand challenges of computer vision.
C# HTML5 PDF Viewer SDK to view PDF document online in C#.NET
VB.NET comment annotate PDF, VB.NET delete PDF pages, VB.NET can view PDF document in single page or continue pages. Support to zoom in and zoom out PDF page.
cut pages from pdf preview; acrobat export pages from pdf
VB.NET PDF- View PDF Online with VB.NET HTML5 PDF Viewer
Auto Fill-in Field Data. Field: Insert, Delete, Update Field. can view PDF document in single page or continue pages. Support to zoom in and zoom out PDF page.
delete a page from a pdf; delete pages in pdf
722
Computer Vision: Algorithms and Applications (September 3, 2010 draft)
14.7 Additional reading
Although there are currently no specialized textbooks on image recognition and scene un-
derstanding, some surveys (Pinz2005) and collections of papers (Ponce,Hebert,Schmidet
al. 2006; Dickinson, Leonardis, Schiele et al. 2007)canbefoundthatdescribethelatestap-
proaches. Other good sources of recent research are courses on this topic, such as the ICCV
2009 short course (Fei-Fei,Fergus,andTorralba2009) and Antonio Torralba’s more com-
prehensive MIT course (Torralba2008). The PASCAL VOC Challenge Web site contains
workshop slides that summarize today’s best performing algorithms.
The literature on face, pedestrian, car, and other object detection is quite extensive. Sem-
inal papers in face detection include those byOsuna,Freund,andGirosi(1997),Sungand
Poggio(1998), Rowley, Baluja, andKanade(1998a),and Viola and Jones(2004),with Yang,
Kriegman, and Ahuja(2002)providingacomprehensivesurveyofearlyworkinthisfield.
Morerecentexamples include (Heisele,Ho,Wuetal.2003;Heisele,Serre,andPoggio2007).
Early work in pedestrian and car detection was carried out byGavrila andPhilomin
(1999),Gavrila(1999),PapageorgiouandPoggio (2000),Mohan,Papageorgiou,andPog-
gio(2001),and Schneiderman and Kanade(2004). Morerecentexamplesincludethework
ofBelongie,Malik,andPuzicha(2002),Mikolajczyk,Schmid,andZisserman(2004),Dalal
and Triggs(2005), Leibe, Seemann, and Schiele(2005), Dalal, Triggs, and Schmid(2006),
Opelt, Pinz, and Zisserman(2006), Torralba(2007), Andriluka, Roth, and Schiele(2008),
Felzenszwalb, McAllester, and Ramanan(2008), Rogez, Rihan, Ramalingam et al.(2008),
Andriluka, Roth, and Schiele(2009), Kumar, Zisserman, and H.S.Torr(2009), Doll`ar, Be-
longie, and Perona(2010).and Felzenszwalb, Girshick, McAllester et al.(2010).
While some of the earliest approaches to face recognition involved finding the distinc-
tive image features and measuring the distances between them (FischlerandElschlager1973;
Kanade 1977; Yuille 1991),morerecentapproachesrelyoncomparinggray-levelimages,
often projected onto lower dimensional subspaces (TurkandPentland1991a;Belhumeur,
Hespanha, and Kriegman 1997; Moghaddam and Pentland 1997; Moghaddam, Jebara, and
Pentland 2000; Heisele, Ho, Wu et al. 2003; Heisele, Serre, and Poggio 2007). Additional
details onprincipal component analysis (PCA) andits Bayesian counterparts can be found in
AppendixB.1.1and books and articles on this topic (Hastie,Tibshirani,andFriedman2001;
Bishop 2006; Roweis 1998; Tipping and Bishop 1999; Leonardis and Bischof 2000; Vidal,
Ma, and Sastry 2010). Thetopicsofsubspacelearning,localdistancefunctions,andmetric
learning are covered byCai,He,Huetal.(2007),Frome,Singer,Shaetal.(2007),Guil-
laumin, Verbeek, and Schmid(2009), Ramanan and Baker(2009),and Sivic, Everingham,
and Zisserman(2009).Analternativetodirectlymatchinggray-levelimagesorpatchesisto
use non-linear local transforms such as local binary patterns (Ahonen,Hadid,andPietik¨ainen
2006; Zhao and Pietik¨ainen 2007; Cao, Yin, Tang et al. 2010).
C# WPF PDF Viewer SDK to view PDF document in C#.NET
Auto Fill-in Field Data. Field: Insert, Delete, Update Field. extract, copy, paste, C#.NET rotate PDF pages, C#.NET Abilities to zoom in and zoom out PDF page.
delete page pdf acrobat reader; delete pages on pdf online
VB.NET PDF replace text library: replace text in PDF content in vb
Able to pull text out of selected PDF page or all PDF document in VB.NET. VB.NET: Replace Text in PDF File. VB.NET: Replace Text in Consecutive PDF Pages.
delete a page from a pdf in preview; delete pages from a pdf reader
14.7 Additional reading
723
In order to boost the performance of what are essentially 2D appearance-based models,
avariety of shape and pose deformation models have been developed (Beymer1996;Vet-
ter and Poggio 1997), includingActiveShapeModels(Lanitis, Taylor, and Cootes 1997;
Cootes, Cooper, Taylor et al. 1995; Davies, Twining, and Taylor 2008),ElasticBunchGraph
Matching (Wiskott,Fellous,Kr¨ugeretal.1997), 3D Morphable Models (BlanzandVetter
1999),andActiveAppearanceModels(Costen, Cootes, Edwards et al. 1999; Cootes, Ed-
wards, and Taylor 2001; Gross, Baker, Matthews et al. 2005; Gross, Matthews, and Baker
2006; Matthews, Xiao, and Baker 2007; Liang, Xiao, Wen et al. 2008; Ramnath, Koterba,
Xiao et al. 2008). Thetopicofheadposeestimation,inparticular,iscoveredinarecent
survey byMurphy-ChutorianandTrivedi(2009).
Additional information about face recognition can be found in a number of surveys and
books on this topic (Chellappa,Wilson,andSirohey1995;Zhao,Chellappa,Phillipsetal.
2003; Li and Jain 2005)aswellasontheFaceRecognitionWebsite.23 Databasesforface
recognitionarediscussedbyPhillips,Moon,Rizvietal.(2000),Sim,Baker,andBsat(2003),
Gross, Shi, and Cohn(2005), Huang, Ramesh, Berg et al.(2007),and Phillips, Scruggs,
O’Toole et al.(2010).
Algorithms for instance recognition, i.e., the detection of static man-made objects that
only vary slightly in appearance but may vary in 3D pose, are mostly based on detecting
2D points of interest and describing them using viewpoint-invariant descriptors (Lowe2004;
Rothganger, Lazebnik, Schmid etal. 2006; Ferrari, Tuytelaars, and Van Gool 2006b;Gordon
and Lowe 2006; Obdrˇz´alek and Matas 2006; Kannala, Rahtu, Brandt et al. 2008; Sivic and
Zisserman 2009).
As the sizeof the database being matched increases, it becomes more efficient to quantize
the visual descriptors into words (SivicandZisserman2003;Schindler,Brown,andSzeliski
2007; Sivic and Zisserman 2009; Turcot and Lowe 2009), andtothenuse e information-
retrieval techniques, such as inverted indices (Nist´erandStew´enius2006;Philbin,Chum,
Isard et al. 2007; Philbin, Chum, Sivic et al. 2008),queryexpansion(Chum, Philbin, Sivic
et al. 2007; Agarwal, Snavely, Simon et al. 2009),andminhashing(Philbin and Zisserman
2008;Li, Wu, Zachet al. 2008;Chum, Philbin, and Zisserman 2008;Chum andMatas 2010)
to perform efficient retrieval and clustering.
Anumber of surveys, collections of papers, and course notes have been written on the
topic of category recognition (Pinz2005;Ponce, Hebert, Schmidetal. 2006;Dickinson,
Leonardis, Schiele et al. 2007; Fei-Fei, Fergus, and Torralba 2009). Someoftheseminal
papers on the bag of words (bag of keypoints) approach towhole-image category recognition
have been written byCsurka,Dance,Fanetal.(2004),Lazebnik,Schmid,andPonce(2006),
Csurka, Dance, Perronninetal.(2006),GraumanandDarrell(2007b),and Zhang, Marszalek,
23
http://www.face-rec.org/.
VB.NET PDF - View PDF with WPF PDF Viewer for VB.NET
Auto Fill-in Field Data. Field: Insert, Delete, Update Field. extract, copy, paste, C#.NET rotate PDF pages, C#.NET Abilities to zoom in and zoom out PDF page.
acrobat extract pages from pdf; delete blank page in pdf online
VB.NET PDF File & Page Process Library SDK for vb.net, ASP.NET
document is unnecessary, you may want to delete this page get a PDF document which is out of order on creating, loading, merge and splitting PDF pages and Files
cut pages out of pdf online; delete pages from pdf document
724
Computer Vision: Algorithms and Applications (September 3, 2010 draft)
Lazebnik et al.(2007).Additionalandmorerecentpapersinthisareainclude Sivic, Russell,
Efros et al.(2005), Serre, Wolf, and Poggio(2005), Opelt, Pinz, Fussenegger et al.(2006),
Grauman and Darrell(2007a), Torralba, Murphy, and Freeman(2007), Boiman, Shechtman,
and Irani(2008), Ferencz, Learned-Miller, and Malik(2008),and Mutch and Lowe(2008).
It is also possible to recognize objects based on their contours, e.g., using shape contexts
(Belongie,Malik,andPuzicha2002) or other techniques (JurieandSchmid2004;Shotton,
Blake, and Cipolla 2005; Opelt, Pinz, andZisserman 2006; Ferrari, Tuytelaars, and VanGool
2006a).
Many object recognition algorithms use part-based decompositions toprovide greater in-
variance to articulation and pose. Early algorithms focused on the relative positions of the
parts (FischlerandElschlager1973;Kanade1977;Yuille1991) while newer algorithms use
more sophisticated models of appearance (FelzenszwalbandHuttenlocher2005;Fergus,Per-
ona, and Zisserman 2007; Felzenszwalb, McAllester, and Ramanan 2008). Goodoverviews
onpart-basedmodels for recognition can be foundin the coursenotes of Fergus2007b;2009.
Carneiro and Lowe(2006)discussanumberofgraphicalmodelsusedforpart-based
recognition, whichinclude trees andstars (FelzenszwalbandHuttenlocher2005;Fergus,Per-
ona, and Zisserman 2005; Felzenszwalb, McAllester, and Ramanan 2008),k-fans(Crandall,
Felzenszwalb, and Huttenlocher 2005; Crandall and Huttenlocher 2006),andconstellations
(Burl,Weber,andPerona1998;Weber,Welling,andPerona2000;Fergus,Perona,andZis-
serman 2007). Othertechniquesthatusepart-basedrecognitionincludethosedevelopedby
Dork´o and Schmid(2003)and Bar-Hillel, Hertz, and Weinshall(2005).
Combining object recognition with scene segmentation can yield strong benefits. One
approach is to pre-segment the image into pieces and then match the pieces to portions of
the model (Mori, Ren, Efros etal. 2004;Mori2005;He,Zemel, andRay2006;Russell,
Efros, Sivic et al. 2006; Borenstein and Ullman 2008; Csurka and Perronnin 2008; Gu, Lim,
Arbelaez et al. 2009). Anotheristovoteforpotentialobjectlocationsandscalesbasedon
object detection (Leibe,Leonardis,andSchiele2008). One of the currently most popular
approaches is to use conditional random fields (KumarandHebert2006;He,Zemel, and
Carreira-Perpi˜n´an2004;He, Zemel, and Ray 2006;Levin and Weiss 2006; Winn and Shotton
2006;Hoiem, Rother, and Winn2007; Rabinovich, Vedaldi, Galleguillos et al. 2007;Verbeek
and Triggs 2007; Yang, Meer, and Foran 2007; Batra, Sukthankar, and Chen 2008; Larlus
and Jurie 2008; He and Zemel 2008; Shotton, Winn, Rother et al. 2009; Kumar, Torr, and
Zisserman 2010),whichproducesomeofthebestresultsonthedifficultPASCALVOCseg-
mentation challenge (Shotton,Johnson,andCipolla2008;Kohli,Ladick
´
y, and Torr 2009).
More and more recognition algorithms are starting to use scene context as part of their
recognition strategy. Representative papers in this area include those byTorralba (2003),
Torralba, Murphy, Freeman et al.(2003), Murphy, Torralba, and Freeman(2003), Torralba,
Murphy, and Freeman(2004), Crandall and Huttenlocher(2007), Rabinovich, Vedaldi, Gal-
C# PDF Image Redact Library: redact selected PDF images in C#.net
Fill-in Field Data. Field: Insert, Delete, Update Field. extract, copy, paste, C#.NET rotate PDF pages, C#.NET NET control allows users to black out image in PDF
delete page on pdf file; add remove pages from pdf
C# PDF Text Extract Library: extract text content from PDF file in
Ability to extract highlighted text out of PDF document. How to C#: Extract Text Content from PDF File. C# example code for text extraction from all PDF pages.
delete pages in pdf online; delete pages of pdf
14.8 Exercises
725
leguillos et al.(2007), Russell, Torralba, Liuet al.(2007),Hoiem, Efros, andHebert(2008a),
Hoiem, Efros, and Hebert(2008b), Sudderth, Torralba, Freeman et al.(2008),and Divvala,
Hoiem, Hays et al.(2009).
Sophisticated machine learning techniques are also becoming a key component of suc-
cessful object detection and recognition algorithms (VarmaandRay2007;Felzenszwalb,
McAllester, and Ramanan 2008; Fritz and Schiele 2008; Sivic, Russell, Zisserman et al.
2008; Vedaldi, Gulshan, Varma et al. 2009),asisexploitinglargehuman-labeleddatabases
(Russell,Torralba,Liuetal.2007;MalisiewiczandEfros2008;Torralba,Freeman,andFer-
gus 2008; Liu, Yuen, and Torralba 2009). Roughthree-dimensionalmodelsarealsomaking
acomeback for recognition, as evidenced in some recent papers (SavareseandFei-Fei2007,
2008; Sun, Su, Savarese et al. 2009; Su, Sun, Fei-Fei et al. 2009).Asalways,thelatestcon-
ferences on computer vision are your best reference for the newest algorithms in this rapidly
evolving field.
14.8 Exercises
Ex 14.1: Face detection Buildandtestone of the facedetectors presentedinSection14.1.1.
1. Download one or more of the labeled face detection databases in Table14.2.
2. Generate your own negative examples by finding photographs that do not contain any
people.
3. Implement one of the following face detectors (or devise one of your own):
 boosting(Algorithm14.1) basedonsimpleareafeatures, withan optional cascade
of detectors (ViolaandJones2004);
 PCA face subspace (MoghaddamandPentland1997);
 distances toclusteredfaceand non-face prototypes, followedby aneural network
(SungandPoggio1998) or SVM (Osuna,Freund,andGirosi1997) classifier;
 a multi-resolutionneural network traineddirectlyonnormalizedgray-levelpatches
(Rowley,Baluja,andKanade1998a).
4. Test the performance of your detector on the database by evaluating the detector at ev-
erylocationin a sub-octave pyramid. Optionally retrain your detector on false positive
examples you get on non-face images.
Ex 14.2: Determining the threshold for AdaBoost Given a set of function evaluations on
the trainingexamples x
i
,f
i
=f(x
i
)2 1, training labels y
i
21, and weights w
i
2(0;1),
726
Computer Vision: Algorithms and Applications (September 3, 2010 draft)
as explained in Algorithm14.1, devise an efficient algorithm to find values of  and s = 1
that maximize
X
i
w
i
y
i
h(sf
i
;);
(14.43)
where h(x;) = sign(x  ).
Ex 14.3: Face recognition using eigenfaces Collect a set of facial photographs and then
build a recognition system to re-recognize the same people.
1. Take several photos of each of your classmates and store them.
2. Align the images by automatically or manually detecting the corners of the eyes and
using a similarity transform to stretch and rotate each image to a canonical position.
3. Compute the average image and a PCA subspace for the face images
4. Take a new set of photographs a week later and use them as your test set.
5. Compare each new image to each database image and select the nearest one as the
recognized identity. Verify that the distance in PCA space is close to the distance
computed with a full SSD (sum of squared difference) measure.
6. (Optional) Compute different principal components for identity and expression, and
use them to improve your recognitionresults.
Ex 14.4: Bayesian face recognition Moghaddam, Jebara, , andPentland(2000) compute
separate covariance matrices 
I
and 
E
by looking at differences between all pairs of im-
ages. Atrun time, they select the nearest image todetermine the facialidentity. Does itmake
sense to estimate statistics for all pairs of images and use them for testing the distance to the
nearest exemplar? Discuss whether this is statistically correct.
How is the all-pair intrapersonal covariance matrix 
I
related to the within-class scatter
matrix S
W
?Does a similar relationship holdbetween 
E
and S
B
?
Ex 14.5: Modular eigenfaces Extendyour facerecognition system to separatelymatch the
eye, nose, and mouth regions, as shown in Figure14.18.
1. After normalizing face images to a canonical scale and location, manually segment out
some of the eye, nose, and face regions.
2. Buildseparatedetectors for thesethree(or four) kinds of region, either using asubspace
(PCA) approach or one of the techniques presented in Section14.1.1.
3. For each new image to be recognized, first detect the locations of the facial features.
14.8 Exercises
727
4. Then, match the individual features against your database and note the locations of
these features.
5. Train and test a classifier that uses the individual feature matching IDs as well as (op-
tionally) the feature locations to perform face recognition.
Ex 14.6: Recognition-based color balancing Build a system that recognizes the most im-
portant color areas in common photographs (sky, grass, skin) and color balances the image
accordingly. Some references and ideas for skin detection are given in Exercise2.8 and
byForsythandFleck (1999),JonesandRehg (2001),Vezhnevets,Sazonov,andAndreeva
(2003), andKakumanu, Makrogiannis,andBourbakis(2007). These may give you ideas
for how to detect other regions or you can try more sophisticated MRF-based approaches
(Shotton,Winn,Rotheretal.2009).
Ex 14.7: Pedestrian detection Build and test one of the pedestrian detectors presented in
Section14.1.2.
Ex 14.8: Simple instance recognition Use the feature detection, matching, and alignment
algorithms you developed in Exercises4.14.4and9.2tofind matchingimages given a query
image or region (Figure14.26).
Evaluate several feature detectors, descriptors, and robust geometric verification strate-
gies, either on your own or by comparing your results withthose of classmates.
Ex 14.9: Large databases and location recognition Extendthe previous exercisetolarger
databases using quantized visual words and information retrieval techniques, as described in
Algorithm14.2.
Test your algorithm on a large database, such as the one used byNist´erandStew´enius
(2006) orPhilbin,Chum,Sivicetal.(2008), which are listed in Table14.1. Alternatively,
use keyword search on the Web or in a photo sharing site (e.g., for a city) to create your own
database.
Ex 14.10: Bag of words Adapt the feature extraction and matching pipeline developed in
Exercise14.8 to category (class) recognition, using some of the techniques described in Sec-
tion14.4.1.
1. Download the training and test images from one or more of the databases listed in
Tables14.1 and14.2, e.g., Caltech 101, Caltech 256, or PASCAL VOC.
2. Extractfeatures from eachof the trainingimages, quantize them, and compute the tf-idf
vectors (bag of words histograms).
728
Computer Vision: Algorithms and Applications (September 3, 2010 draft)
3. As anoption, consider not quantizing the features and using pyramid matching (14.40
14.41)(GraumanandDarrell2007b)orusingaspatialpyramidforgreaterselectivity
(Lazebnik,Schmid,andPonce2006).
4. Choose aclassificationalgorithm (e.g., nearest neighbor classification or supportvector
machine) and“train”your recognizer, i.e., builduptheappropriate data structures (e.g.,
k-d trees) or set the appropriate classifier parameters.
5. Test your algorithm on the test data set using the same pipeline you developed in steps
2–4 and compare your results to the best reported results.
6. Explain why your results differ from the previously reported ones and give some ideas
for how you could improve your system.
You can find a good synopsis of the best-performing classification algorithms and their ap-
proaches in the report of the PASCAL Visual Object Classes Challenge found on their Web
site (http://pascallin.ecs.soton.ac.uk/challenges/VOC/).
Ex 14.11: Object detection and localization Extendthe classificationalgorithm developed
inthe previous exercisetolocalizetheobjects inanimagebyreportinga bounding boxaround
each detected object. The easiest way to do this is to use a sliding window approach. Some
pointers to recent techniques in this area can be found in the workshop associated with the
PASCAL VOC 2008 Challenge.
Ex 14.12: Part-based recognition Chooseoneor more of the techniques describedinSec-
tion14.4.2 and implement a part-based recognition system. Since these techniques are fairly
involved, you will need to read several of the research papers in this area, select which gen-
eral approach you want to follow, and then implement your algorithm. A good starting point
could be the paper byFelzenszwalb,McAllester,andRamanan (2008), since it performed
well in the PASCAL VOC 2008 detection challenge.
Ex 14.13: Recognition and segmentation Chooseone ormoreof the techniques described
in Section14.4.3 and implement a simultaneous recognition and segmentation system. Since
these techniquesarefairly involved, you willneedto readseveralof the research papers inthis
area, select which general approach you want to follow, and then implement your algorithm.
Test your algorithm on one or more of the segmentation databases in Table14.2.
Ex 14.14: Context Implement one or more of the context and scene understanding sys-
tems described in Section14.5 and report on your experience. Does context or whole scene
understanding perform better at naming objects thanstand-alone systems?
Documents you may be interested
Documents you may be interested