c# ghostscript pdf to image : Create fillable pdf form from word application Library tool html asp.net windows online tm3-part1012

Source
31
## S3 method for class DataframeSource
getElem(x)
## S3 method for class DirSource
getElem(x)
## S3 method for class URISource
getElem(x)
## S3 method for class VectorSource
getElem(x)
## S3 method for class XMLSource
getElem(x)
## S3 method for class SimpleSource
length(x)
## S3 method for class SimpleSource
open(con, ...)
## S3 method for class DataframeSource
pGetElem(x)
## S3 method for class DirSource
pGetElem(x)
## S3 method for class URISource
pGetElem(x)
## S3 method for class VectorSource
pGetElem(x)
## S3 method for class SimpleSource
reader(x)
## S3 method for class SimpleSource
stepNext(x)
Arguments
x
ASource.
con
ASource.
encoding
acharacter giving the encoding of the elements delivered bythe source.
length
anon-negative integer denoting the number of elements deliveredby the source.
If the length is unknown in advance set it to 0.
position
anumeric indicating the current position in the source.
reader
areader function (generator).
...
For SimpleSource tag-value pairs for storing additional information; not used
otherwise.
class
acharacter vector giving additional classes to be used for the created source.
Details
Sources abstract input locations, like a directory, a connection, or simply an R vector, in order to
acquire content in auniform way. Inpackageswhich employthe infrastructureprovidedbypackage
tm, such sources are represented via the virtual S3 class Source: such packages then provide S3
source classes extending the virtual base class (such asDirSource provided by package tm itself).
Create fillable pdf form from word - C# PDF Form Data fill-in Library: auto fill-in PDF form data in C#.net, ASP.NET, MVC, WinForms, WPF
Online C# Tutorial to Automatically Fill in Field Data to PDF
allow users to attach to pdf form; fillable pdf forms
Create fillable pdf form from word - VB.NET PDF Form Data fill-in library: auto fill-in PDF form data in vb.net, ASP.NET, MVC, WinForms, WPF
VB.NET PDF Form Data fill-in library: auto fill-in PDF form data in vb.net, ASP.NET, MVC, WinForms, WPF
convert excel to fillable pdf form; pdf form filler
32
stemCompletion
Allextension classes must provide implementations for the functions close, eoi, getElem, length,
open, reader, and stepNext. For parallel element access the functionpGetElem must be provided
as well.
The functions open and close open and close the source, respectively. eoi indicates end of input.
getElem fetches the element at the current position, whereas pGetElem retrieves all elements in
parallel at once. The function length gives the number of elements. reader returns a default
reader for processing elements. stepNext increases the position in the source to acquire the next
element.
The function SimpleSource provides a simple reference implementation and can be used when
creating custom sources.
Value
For SimpleSource, an object inheriting from class, SimpleSource, and Source.
For getSources, a character vector with sources provided by package tm.
open and close return the opened andclosed source, respectively.
For eoi, a logical indicating if the end of input of the source is reached.
For getElem a named list with the components content holding the document and uri giving a
uniform resource identifier (e.g., a file path or
URL
;NULL if not applicable or unavailable). For
pGetElem a list of such named lists.
For length, an integer for the number of elements.
For reader, a function for the default reader.
See Also
DataframeSource, DirSource, URISource, VectorSource,and XMLSource.
stemCompletion
Complete Stems
Description
Heuristically complete stemmed words.
Usage
stemCompletion(x,
dictionary,
type = c("prevalent", "first", "longest",
"none", "random", "shortest"))
C# Create PDF Library SDK to convert PDF from other file formats
to create searchable PDF document from Microsoft Office Word, Excel and Create and save editable PDF with a blank page Create fillable PDF document with fields.
create a fillable pdf form in word; create fillable form pdf online
VB.NET Create PDF from OpenOffice to convert odt, odp files to PDF
Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Create PDF document from OpenOffice Text Document with ODT, ODS, ODP forms into fillable PDF formats
convert html form to pdf fillable form; convert pdf fill form
stemDocument
33
Arguments
x
Acharacter vector of stems to be completed.
dictionary
ACorpus or character vector to be searched for possible completions.
type
Acharacter naming the heuristics to be used:
prevalent Default. Takes the most frequent match as completion.
first Takes the first found completion.
longest Takes the longest completion in terms of characters.
none Is the identity.
random Takes some completion.
shortest Takes the shortest completion in terms of characters.
Value
Acharacter vector with completed words.
References
Ingo Feinerer (2010). Analysis and Algorithms for Stemming Inversion. Information Retrieval
Technology — 6th Asia Information Retrieval Societies Conference, AIRS 2010, Taipei, Taiwan,
December 1–3, 2010. Proceedings, volume 6458 of Lecture Notes in Computer Science, pages
290–299. Springer-Verlag, December 2010.
Examples
data("crude")
stemCompletion(c("compan", "entit", "suppl"), crude)
stemDocument
Stem Words
Description
Stem words in a text document using Porter’s stemming algorithm.
Usage
## S3 method for class PlainTextDocument
stemDocument(x, language = meta(x, "language"))
Arguments
x
Atext document.
language
Acharacter giving the language for stemming.
C# Create PDF from OpenOffice to convert odt, odp files to PDF in
Create PDF document from OpenOffice Presentation in both .NET WinForms and ASP to change ODT, ODS, ODP forms to fillable PDF formats in RasterEdge.XDoc.PDF.dll.
convert pdf file to fillable form online; create a fillable pdf form from a word document
VB.NET Create PDF Library SDK to convert PDF from other file
component to convert Microsoft Office Word, Excel and Create and save editable PDF with a blank Create fillable PDF document with fields in Visual Basic .NET
convert an existing form into a fillable pdf form; convert pdf to fillable pdf form
34
stopwords
Details
The argument languageis passed over towordStem as the name of the Snowball stemmer.
Examples
data("crude")
crude[[1]]
stemDocument(crude[[1]])
stopwords
Stopwords
Description
Return various kinds of stopwords with support for different languages.
Usage
stopwords(kind = "en")
Arguments
kind
Acharacter string identifying the desired stopword list.
Details
Available stopword lists are:
catalan Catalan stopwords (obtained fromhttp://latel.upf.edu/morgana/altres/pub/ca_
stop.htm),
romanian Romanian stopwords (extracted fromhttp://snowball.tartarus.org/otherapps/
romanian/romanian1.tgz),
SMART English stopwords from the SMART information retrieval system (obtained fromhttp://
jmlr.csail.mit.edu/papers/volume5/lewis04a/a11-smart-stop-list/english.stop)
(which coincides with the stopword list used by the MC toolkit (http://www.cs.utexas.
edu/users/dml/software/mc/)),
and a setof stopword lists from the Snowball stemmer projectindifferent languages (obtained from
‘http://svn.tartarus.org/snowball/trunk/website/algorithms/*/stop.txt’). Supported
languagesaredanish, dutch, english, finnish, french, german, hungarian, italian, norwegian,
portuguese, russian, spanish, and swedish. Language names are case sensitive. Alternatively,
their
IETF
language tags may be used.
Value
Acharacter vector containing the requested stopwords. An error is raised if no stopwords are
available for the requested kind.
C# PDF Field Edit Library: insert, delete, update pdf form field
A professional PDF form creator supports to create fillable PDF form in C#.NET. An advanced PDF form maker allows users to create editable PDF form in C#.NET.
change font size pdf fillable form; pdf fill form
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
formatting. Create PDF files from both DOC and DOCX formats. Convert multiple pages Word to fillable and editable PDF documents. Professional
adding a signature to a pdf form; convert pdf fillable forms
stripWhitespace
35
Examples
stopwords("en")
stopwords("SMART")
stopwords("german")
stripWhitespace
Strip Whitespace from a Text Document
Description
Strip extra whitespace from a text document. Multiple whitespace characters are collapsed to a
single blank.
Usage
## S3 method for class PlainTextDocument
stripWhitespace(x, ...)
Arguments
x
Atext document.
...
Not used.
Value
The text document withmultiple whitespace characters collapsed to a single blank.
See Also
getTransformationstolistavailabletransformation(mapping)functions.
Examples
data("crude")
crude[[1]]
stripWhitespace(crude[[1]])
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
Convert multiple pages Word to fillable and editable PDF Convert both DOC and DOCX formats to PDF files. Easy to create searchable and scanned PDF files from
change font pdf fillable form; acrobat fill in pdf forms
VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to
Convert multiple pages PowerPoint to fillable and editable PDF documents. Easy to create searchable and scanned PDF files from PowerPoint.
converting a word document to a fillable pdf form; add fillable fields to pdf
36
TermDocumentMatrix
TermDocumentMatrix
Term-Document Matrix
Description
Constructs or coerces to a term-document matrix or a document-term matrix.
Usage
TermDocumentMatrix(x, control = list())
DocumentTermMatrix(x, control = list())
as.TermDocumentMatrix(x, ...)
as.DocumentTermMatrix(x, ...)
Arguments
x
acorpus for the constructors and either a term-document matrixor a document-
term matrixor asimpletripletmatrix (package slam) or atermfrequencyvector
for the coercing functions.
control
anamed list of control options. There are local options which are evaluated for
each document and global options which are evaluated once for the constructed
matrix. Available local options are documented intermFreq and are internally
delegated to atermFreq call. Available global options are:
bounds Alistwitha tag globalwhose value mustbe aninteger vector of length
2. Terms thatappear inlessdocumentsthanthe lower boundbounds$global[1]
or in more documents than the upper bound bounds$global[2] are dis-
carded. Defaults to list(global = c(1, Inf)) (i.e., every term will be
used).
weighting A weighting functioncapable of handling a TermDocumentMatrix.
It defaults to weightTf for term frequency weighting. Available weight-
ing functions shipped with the tm package areweightTf,weightTfIdf,
weightBin,and weightSMART.
...
the additional argument weighting (typically aWeightFunction) is allowed
when coercing a simple triplet matrix to a term-document or document-term
matrix.
Value
An object of class TermDocumentMatrix or class DocumentTermMatrix (both inheriting from a
simple triplet matrixinpackageslam)containingasparseterm-documentmatrixordocument-term
matrix. The attribute Weighting contains the weighting applied to the matrix.
See Also
termFreqforavailablelocalcontroloptions.
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
Link: Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. Form Process. Create fillable and editable PDF documents from Excel in Visual
converting a word document to pdf fillable form; convert word form to pdf with fillable
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
C#.NET PDF SDK- Create PDF from Word in Visual Evaluation library and components for PDF creation from Create fillable and editable PDF documents from Excel in
change pdf to fillable form; convert pdf fillable form to html
termFreq
37
Examples
data("crude")
tdm <- TermDocumentMatrix(crude,
control = list(removePunctuation = TRUE,
stopwords = TRUE))
dtm <- DocumentTermMatrix(crude,
control = list(weighting =
function(x)
weightTfIdf(x, normalize =
FALSE),
stopwords = TRUE))
inspect(tdm[202:205, 1:5])
inspect(tdm[c("price", "texas"), c("127", "144", "191", "194")])
inspect(dtm[1:5, 273:276])
termFreq
Term Frequency Vector
Description
Generate a term frequency vector from a text document.
Usage
termFreq(doc, control = list())
Arguments
doc
An object inheriting fromTextDocument.
control
Alist of control options whichoverride default settings.
First, following two options are processed.
tokenize Afunctiontokenizing aTextDocumentintosingle tokens, aSpan_Tokenizer,
Token_Tokenizer,orastringmatchingoneofthepredefinedtokenization
functions:
"MC" forMC_tokenizer, or
"scan" forscan_tokenizer, or
"words" forwords.
Defaults towords.
tolower Either a logical value indicating whether characters should be trans-
lated tolower case or acustom function convertingcharacters tolower case.
Defaults totolower.
Next, a set of options which are sensitive to the order of occurrence in the
control list. Options are processed in the same order as specified. User-
specified options have precedence over the default ordering so that first alluser-
specified options and then allremainingoptions (with the default settings andin
the order as listed below) are processed.
38
termFreq
removePunctuation Alogicalvalueindicatingwhether punctuationcharacters
should be removed from doc, a custom function which performs punctua-
tion removal, or a list of arguments forremovePunctuation. Defaults to
FALSE.
removeNumbers A logicalvalueindicatingwhether numbersshouldberemoved
from doc or a custom function for number removal. Defaults to FALSE.
stopwords Either a Boolean value indicating stopword removal using default
language specific stopword lists shipped withthis package, acharacter vec-
tor holding custom stopwords, or a custom function for stopword removal.
Defaults to FALSE.
stemming Either a Booleanvalueindicatingwhether tokens shouldbe stemmed
or a custom stemming function. Defaults to FALSE.
Finally, following options are processed in the given order.
dictionary A character vector to be tabulated against. No other terms will be
listed in the result. Defaults to NULL which means that all terms in doc are
listed.
bounds A list with a tag localwhose value must be aninteger vector of length
2. Terms thatappear lessoftenindoc thanthe lower boundbounds$local[1]
or more often than the upper bound bounds$local[2] are discarded. De-
faults to list(local = c(1, Inf)) (i.e., every token will be used).
wordLengths An integer vector of length 2. Words shorter than the minimum
word length wordLengths[1] or longer than the maximum word length
wordLengths[2] are discarded. Defaults to c(3, Inf), i.e., a minimum
word length of 3 characters.
Value
Anamed integer vector of class term_frequency with term frequencies as values and tokens as
names.
See Also
getTokenizers
Examples
data("crude")
termFreq(crude[[14]])
strsplit_space_tokenizer <- function(x)
unlist(strsplit(as.character(x), "[[:space:]]+"))
ctrl <- list(tokenize = strsplit_space_tokenizer,
removePunctuation = list(preserve_intra_word_dashes = TRUE),
stopwords = c("reuter", "that"),
stemming = TRUE,
wordLengths = c(4, Inf))
termFreq(crude[[14]], control = ctrl)
TextDocument
39
TextDocument
Text Documents
Description
Representing and computing ontext documents.
Details
Text documents are documents containing (natural language) text. The tm package employs the
infrastructure provided by package NLP and represents text documents via the virtual S3 class
TextDocument. Actual S3textdocumentclasses thenextendthe virtualbaseclass(such asPlainTextDocument).
All extension classes must provide anas.character method which extracts the natural language
text indocuments of the respective classes in a “suitable” (not necessarily structured) form, as well
ascontent andmeta methods for accessing the (possibly raw) document content and metadata.
See Also
PlainTextDocument,and XMLTextDocumentforthetextdocumentclassesprovidedbypackage
tm.
TextDocumentfortextdocumentsinpackageNLP.
tm_combine
Combine Corpora, Documents, Term-Document Matrices, and Term
Frequency Vectors
Description
Combine several corpora into a single one, combine multiple documents into a corpus, combine
multiple term-document matrices into a single one, or combine multiple term frequency vectors
into a single term-document matrix.
Usage
## S3 method for class VCorpus
c(..., recursive = FALSE)
## S3 method for class TextDocument
c(..., recursive = FALSE)
## S3 method for class TermDocumentMatrix
c(..., recursive = FALSE)
## S3 method for class term_frequency
c(..., recursive = FALSE)
40
tm_filter
Arguments
...
Corpora, text documents, term-document matrices, or term frequency vectors.
recursive
Not used.
See Also
VCorpus, TextDocument, TermDocumentMatrix,and termFreq.
Examples
data("acq")
data("crude")
meta(acq, "comment", type = "corpus") <- "Acquisitions"
meta(crude, "comment", type = "corpus") <- "Crude oil"
meta(acq, "acqLabels") <- 1:50
meta(acq, "jointLabels") <- 1:50
meta(crude, "crudeLabels") <- letters[1:20]
meta(crude, "jointLabels") <- 1:20
c(acq, crude)
meta(c(acq, crude), type = "corpus")
meta(c(acq, crude))
c(acq[[30]], crude[[10]])
c(TermDocumentMatrix(acq), TermDocumentMatrix(crude))
tm_filter
Filter and Index Functions on Corpora
Description
Interface to apply filter and index functions to corpora.
Usage
## S3 method for class PCorpus
tm_filter(x, FUN, ...)
## S3 method for class VCorpus
tm_filter(x, FUN, ...)
## S3 method for class PCorpus
tm_index(x, FUN, ...)
## S3 method for class VCorpus
tm_index(x, FUN, ...)
Arguments
x
Acorpus.
FUN
afilter function taking a text document as input and returning a logical value.
...
arguments to FUN.
Documents you may be interested
Documents you may be interested