c# open pdf file in adobe reader : Delete page from pdf file control application system azure html winforms console tm0-part1469

Package ‘tm’
July3,2015
Title TextMiningPackage
Version 0.6-2
Date 2015-07-02
Depends R(>=3.1.0),NLP(>=0.1-6.2)
Imports parallel,slam(>=0.1-31),stats,tools,utils,graphics
Suggests filehash,methods,Rcampdf,Rgraphviz,Rpoppler,SnowballC,
tm.lexicon.GeneralInquirer,XML
SystemRequirements Antiword(<http://www.winfield.demon.nl/>)for
readingMSWordfiles,pdfinfoandpdftotextfromPoppler
(<http://poppler.freedesktop.org/>)forreadingPDF
Description AframeworkfortextminingapplicationswithinR.
License GPL-3
URL http://tm.r-forge.r-project.org/
Additional_repositories http://datacube.wu.ac.at
NeedsCompilation yes
Author IngoFeinerer[aut,cre],
KurtHornik[aut],
ArtifexSoftware,Inc.[ctb,cph](pdf_info.pstakenfromGPL
Ghostscript)
Maintainer IngoFeinerer<feinerer@logic.at>
Repository CRAN
Date/Publication 2015-07-0310:43:07
Rtopicsdocumented:
acq. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
content_transformer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
Corpus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
crude . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
DataframeSource . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1
Delete page from pdf file - remove PDF pages in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Provides Users with Mature Document Manipulating Function for Deleting PDF Pages
add remove pages from pdf; add or remove pages from pdf
Delete page from pdf file - VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Visual Basic Sample Codes to Delete PDF Document Page in .NET
delete pages of pdf preview; delete pdf pages
2
Rtopicsdocumented:
DirSource . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
Docs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
findAssocs. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
findFreqTerms. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
foreign. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
getTokenizers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
getTransformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
inspect . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
meta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
PCorpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
PlainTextDocument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
plot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
readDOC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
Reader . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
readPDF . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
readPlain . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
readRCV1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
readReut21578XML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
readTabular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
readTagged . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
readXML . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
removeNumbers. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
removePunctuation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
removeSparseTerms. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
removeWords . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
Source . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
stemCompletion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
stemDocument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
stopwords . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
stripWhitespace . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
TermDocumentMatrix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
termFreq. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
TextDocument. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
tm_combine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
tm_filter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
tm_map . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
tm_reduce . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
tm_term_score . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
tokenizer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
URISource . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
VCorpus. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
VectorSource . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
weightBin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
WeightFunction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
weightSMART . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
weightTf. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
weightTfIdf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
writeCorpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
C# PDF File & Page Process Library SDK for C#.net, ASP.NET, MVC
C# File: Merge PDF; C# File: Split PDF; C# Page: Insert PDF pages; C# Page: Delete PDF pages; C# Read: PDF Text Extract; C# Read: PDF
delete page pdf file reader; delete pages from a pdf document
VB.NET PDF File & Page Process Library SDK for vb.net, ASP.NET
your PDF document is unnecessary, you may want to delete this page adding a page into PDF document, deleting unnecessary page from PDF file and changing
delete page on pdf; delete pdf pages ipad
acq
3
XMLSource . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
XMLTextDocument . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
Zipf_n_Heaps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
ZipSource . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
Index
57
acq
50ExemplaryNewsArticlesfromtheReuters-21578DataSetofTopic
acq
Description
Thisdatasetholds50newsarticleswithadditionalmetainformationfromtheReuters-21578data
set.Alldocumentsbelongtothetopicacqdealingwithcorporateacquisitions.
Usage
data("acq")
Format
AVCorpusof50textdocuments.
Source
Reuters-21578TextCategorizationCollectionDistribution1.0(
XML
format).
References
Lewis,David(1997)Reuters-21578TextCategorizationCollectionDistribution1.0.http://kdd.
ics.uci.edu/databases/reuters21578/reuters21578.html
Luz,Saturnino
XML
-encodedversionofReuters-21578.http://ronaldo.cs.tcd.ie/esslli07/
data/reuters21578-xml/
Examples
data("acq")
acq
C# PDF Page Insert Library: insert pages into PDF file in C#.net
page processing functions, such as how to merge PDF document files by C# code, how to rotate PDF document page, how to delete PDF page using C#
delete page on pdf reader; delete pages out of a pdf
C# PDF File Split Library: Split, seperate PDF into multiple files
Besides, in the process of splitting PDF document, developers can also remove certain PDF page from target PDF file using C#.NET PDF page deletion API.
add and remove pages from pdf file online; delete blank pages in pdf files
4
Corpus
content_transformer
ContentTransformers
Description
Createcontenttransformers,i.e.,functionswhichmodifythecontentofanRobject.
Usage
content_transformer(FUN)
Arguments
FUN
afunction.
Value
Afunctionwithtwoarguments:
x anRobjectwithimplementedcontentgetter(content)andsetter(content<-)functions.
... argumentspassedovertoFUN.
SeeAlso
tm_mapforaninterfacetoapplytransformationstocorpora.
Examples
data("crude")
crude[[1]]
(f <- content_transformer(function(x, pattern) gsub(pattern, "", x)))
tm_map(crude,f, "[[:digit:]]+")[[1]]
Corpus
Corpora
Description
Representingandcomputingoncorpora.
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
using RasterEdge.XDoc.PDF; Add and Insert a Page to PDF File Using VB. doc2.Save( outPutFilePath). Add and Insert Blank Page to PDF File Using VB.
delete pages on pdf file; delete page in pdf online
VB.NET PDF File Compress Library: Compress reduce PDF size in vb.
Since images are usually or large size, images size reducing can help to reduce PDF file size effectively. Delete unimportant contents Embedded page thumbnails.
delete a page from a pdf; delete pages from a pdf
crude
5
Details
Corporaarecollectionsofdocumentscontaining(naturallanguage)text.Inpackageswhichemploy
theinfrastructureprovided bypackagetm,suchcorporaarerepresentedviathevirtualS3class
Corpus: suchpackagesthen provideS3corpusclassesextending thevirtual baseclass(such as
VCorpusprovidedbypackagetmitself).
Allextensionclassesmustprovideaccessorstoextractsubsets([),individualdocuments([[),and
metadata(meta). Thefunctionlengthmustreturnthenumberofdocuments,andas.listmust
constructalistholdingthedocuments.
Acorpuscanhavetwotypesofmetadata(accessibleviameta). Corpusmetadatacontainscorpus
specificmetadatainformoftag-valuepairs. Documentlevelmetadatacontainsdocumentspecific
metadatabutisstoredinthecorpusasadataframe. Documentlevel metadataistypicallyused
forsemanticreasons(e.g.,classificationsofdocumentsformanownentityduetosomehigh-level
informationliketherangeofpossiblevalues)orforperformancereasons(singleaccessinsteadof
extractingmetadataofeachdocument).
SeeAlso
VCorpus,and PCorpusforthecorporaclassesprovidedbypackagetm.
DCorpusforadistributedcorpusclassprovidedbypackagetm.plugin.dc.
crude
20ExemplaryNewsArticlesfromtheReuters-21578DataSetofTopic
crude
Description
Thisdatasetholds20newsarticleswithadditionalmetainformationfromtheReuters-21578data
set.Alldocumentsbelongtothetopiccrudedealingwithcrudeoil.
Usage
data("crude")
Format
AVCorpusof20textdocuments.
Source
Reuters-21578TextCategorizationCollectionDistribution1.0(
XML
format).
References
Lewis,David(1997)Reuters-21578TextCategorizationCollectionDistribution1.0.http://kdd.
ics.uci.edu/databases/reuters21578/reuters21578.html
Luz,Saturnino
XML
-encodedversionofReuters-21578.http://ronaldo.cs.tcd.ie/esslli07/
data/reuters21578-xml/
C# PDF File Compress Library: Compress reduce PDF size in C#.net
Since images are usually or large size, images size reducing can help to reduce PDF file size effectively. Delete unimportant contents Embedded page thumbnails.
delete page in pdf file; delete pages from pdf document
C# PDF File Merge Library: Merge, append PDF files in C#.net, ASP.
document file, and choose to create a new PDF file in .NET NET document imaging toolkit, also offers other advanced PDF document page processing and
add and delete pages in pdf; pdf delete page
6
DataframeSource
Examples
data("crude")
crude
DataframeSource
DataFrameSource
Description
Createadataframesource.
Usage
DataframeSource(x)
Arguments
x
Adataframegivingthetexts.
Details
Adataframesourceinterpretseachrowofthedataframexasadocument.
Value
AnobjectinheritingfromDataframeSource,SimpleSource,andSource.
SeeAlso
Sourceforbasicinformationonthesourceinfrastructureemployedbypackagetm.
Examples
docs <- data.frame(c("This is a text.", "This another one."))
(ds <- DataframeSource(docs))
inspect(VCorpus(ds))
DirSource
7
DirSource
DirectorySource
Description
Createadirectorysource.
Usage
DirSource(directory = ".",
encoding = "",
pattern = NULL,
recursive = FALSE,
ignore.case = FALSE,
mode = "text")
Arguments
directory
Acharactervectoroffullpathnames; thedefaultcorrespondstotheworking
directorygetwd().
encoding
acharacterstringdescribingthecurrentencoding.Itispassedtoiconvtocon-
verttheinputtoUTF-8.
pattern
anoptionalregularexpression.Onlyfilenameswhichmatchtheregularexpres-
sionwillbereturned.
recursive
logical.Shouldthelistingrecurseintodirectories?
ignore.case
logical.Shouldpattern-matchingbecase-insensitive?
mode
acharacterstringspecifyingifandhowfilesshouldbereadin.Availablemodes
are:
"" Noread.InthiscasegetElemandpGetElemonlydeliver
URI
s.
"binary" Filesarereadinbinaryrawmode(viareadBin).
"text" Filesarereadastext(viareadLines).
Details
Adirectorysourceacquiresalistoffilesviadirandinterpretseachfileasadocument.
Value
AnobjectinheritingfromDirSource,SimpleSource,andSource.
SeeAlso
Sourceforbasicinformationonthesourceinfrastructureemployedbypackagetm.
Encodingandiconvonencodings.
8
Docs
Examples
DirSource(system.file("texts", "txt", package = "tm"))
Docs
AccessDocumentIDsandTerms
Description
Accessingdocument IDs,terms,andtheirnumberofaterm-documentmatrixordocument-term
matrix.
Usage
Docs(x)
nDocs(x)
nTerms(x)
Terms(x)
Arguments
x
EitheraTermDocumentMatrixorDocumentTermMatrix.
Value
ForDocsandTerms,acharactervectorwithdocumentIDsandterms,respectively.
FornDocsandnTerms,anintegerwiththenumberofdocumentIDsandterms,respectively.
Examples
data("crude")
tdm <- TermDocumentMatrix(crude)[1:10,1:20]
Docs(tdm)
nDocs(tdm)
nTerms(tdm)
Terms(tdm)
findAssocs
9
findAssocs
FindAssociationsinaTerm-DocumentMatrix
Description
Findassociationsinadocument-termorterm-documentmatrix.
Usage
## S3 method for class DocumentTermMatrix
findAssocs(x, terms, corlimit)
## S3 method for class TermDocumentMatrix
findAssocs(x, terms, corlimit)
Arguments
x
ADocumentTermMatrixoraTermDocumentMatrix.
terms
acharactervectorholdingterms.
corlimit
anumericvector(ofthesamelengthasterms;recycledotherwise)forthe(in-
clusive)lowercorrelationlimitsofeachtermintherangefromzerotoone.
Value
Anamedlist. Eachlistcomponentisnamedafteratermintermsandcontainsanamednumeric
vector. Each vector holdsmatching termsfromx and their rounded correlations satisfying the
inclusivelowercorrelationlimitofcorlimit.
Examples
data("crude")
tdm <- TermDocumentMatrix(crude)
findAssocs(tdm, c("oil", "opec", "xyz"), c(0.7, 0.75, 0.1))
findFreqTerms
FindFrequentTerms
Description
Findfrequenttermsinadocument-termorterm-documentmatrix.
Usage
findFreqTerms(x, lowfreq = 0, highfreq = Inf)
10
foreign
Arguments
x
ADocumentTermMatrixorTermDocumentMatrix.
lowfreq
Anumericforthelowerfrequencybound.
highfreq
Anumericfortheupperfrequencybound.
Details
Thismethodworksforallnumericweightingsbutisprobablymostmeaningfulforthestandard
termfrequency(tf)weightingofx.
Value
Acharactervectoroftermsinxwhichoccurmoreorequaloftenthanlowfreqtimesandlessor
equaloftenthanhighfreqtimes.
Examples
data("crude")
tdm <- TermDocumentMatrix(crude)
findFreqTerms(tdm, 2, 3)
foreign
ReadDocument-TermMatrices
Description
Readdocument-termmatricesstoredinspecialfileformats.
Usage
read_dtm_Blei_et_al(file, vocab = NULL)
read_dtm_MC(file, scalingtype = NULL)
Arguments
file
acharacterstringwiththenameofthefiletoread.
vocab
acharacterstringwiththenameofavocabularyfile(givingtheterms,oneper
line),orNULL.
scalingtype
acharacterstringspecifyingthetypeofscalingtobeused,orNULL(default),in
whichcasethescalingwillbeinferredfromthenamesofthefileswithnon-zero
entriesfound(seeDetails).
Documents you may be interested
Documents you may be interested