display pdf in browser from byte array c# : Rotate pdf page and save Library application component asp.net html web page mvc 1361039_wordsmith20-part198

187
WordList
© 2010 Mike Scott
9.7
detailed consistency relations
With a detailed consistency list
such as this, of five versions of the fairy story Little Red Riding
Hood,
it looks as if the most long-winded story is probably version 5 (red5.lst). If you click the detailed
cons. relation tab
you can see the relevant statistics more usefully:
where it can be seen that red5 has a word-count of 462 words, more than any other, and that the
relation between red2 and red3 is the closest with a relation statistic of 0.487. This relation is the
Dice coefficient
, based on the joint frequency (there are 138 matches in the vocabulary of these
two versions) and the word-counts of the two texts.  A Dice coefficient ranges between 0 and 1. 
The 0.487 can be thought of like a percentage, i.e. there's about a 49% overlap between the
vocabularies of the two versions of the same story. 
See also : Detailed Consistency
.
184
322
184
Rotate pdf page and save - rotate PDF page permanently in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Users to Change the Rotation Angle of PDF File Page Using C#
pdf rotate single page reader; rotate pdf pages and save
Rotate pdf page and save - VB.NET PDF Page Rotate Library: rotate PDF page permanently in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
PDF Document Page Rotation in Visual Basic .NET Class Application
rotate pdf page and save; pdf rotate page and save
188
WordSmith Tools
© 2010 Mike Scott
9.8
consistency analysis (simple)
This function (termed "range" by Paul Nation
) comes automatically with any word-list.
In any word-list you will see a column headed "Texts". This shows the number of texts each word
occurred in (the maximum here being the total number of text-files used for the word-list).
The point of it…
The idea is to find out which words recur consistently in lots of texts of a given genre. For
example, the word 
consolidate
was found to occur in many of a set of business Annual Reports.
It did not occur very often in each of them, but did occur much more consistently in the business
reports than in a mixed set of texts. 
Naturally, words like 
the
are consistent across nearly all texts in English. (While working on a set
of word lists to compare with business reports, I found one text without the. I also discovered that
one of my texts was in Italian: but this wasn't the one without the! The culprit was an election
results list, which contained lots of instances of Cons., Lab. and place names, but no
instances of the.) 
To analyse common grammar words like 
the
, a consistency list may be very useful. Even so,
you're likely to find some common lexical items recur surprisingly consistently. 
To eliminate the commonly consistent words and find only those which seem to characterise your
genre or sub-genre, you need to find out which are significantly consistent. Save your word list,
then use it for comparison
with others in WordList, or using KeyWords. This way you can
determine which are the significantly consistent words in your genre or sub-genre.
See also: Consistency Analysis (Detailed)
Comparing Word-lists
Match List
9.9
compute key words
With a word list visible in the WordList tool, you may choose Compute | KeyWords to get a
keywords analysis of the current word list. This will assume you will wish to use the reference
corpus
defined in the settings
for comparison.
You will see the results in one of the tabs at the bottom of the screen.
As in the KeyWords tool, this procedure compares all the words in your original word list with those
in the reference corpus but does not inform you about words which are only found in the reference
corpus. 
See also : Compare two wordlists
word-list with tags as prefix
181
184
181
64
334
176
181
224
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
this RasterEdge XDoc.PDF SDK, you can simply delete a single page from a PDF document using VB.NET or remove any page from a PDF document and save to local
rotate individual pages in pdf reader; how to reverse page order in pdf
C# PDF Page Insert Library: insert pages into PDF file in C#.net
those page processing functions, such as how to merge PDF document files by C# code, how to rotate PDF document page Add and Insert Blank Page to PDF File in
pdf rotate page; rotate pdf pages on ipad
189
WordList
© 2010 Mike Scott
9.10
find filenames
If you have an index-based word list on screen you can see how many text files each word was
found in. For example, in this index based on Shakespeare plays, EYES AND EARS occurs in 7 of
the 37 plays. 
What if you want to know which of those plays? 
Select the word(s) or cluster(s) you're interested in and choose File | Find Files in the menu and
you will get something like this:
See also : selecting multiple entries
making a WordList index
335
194
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
doc.Save(outPutFilePath); Related APIs (PDFDocument.cs): public override void DeletePage(int pageId). Description: Delete specified page from the input PDF file
rotate pages in pdf expert; pdf rotate pages separately
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
outPutFilePath As String = Program.RootPath + "\\" Output.pdf" Dim doc1 doc2.InsertPage(page, pageIndex) ' Output the new document. doc2.Save(outPutFilePath
rotate pdf pages individually; rotate all pages in pdf
190
WordSmith Tools
© 2010 Mike Scott
9.11
Lemmas (joining words)
9.11.1
what are lemmas and how do we join words?
In a word list, a key word list or a list of collocates you may want to store several entries together:
e.g. want; wants; wanting; wanted. Bringing them together means you're treating them as
members of the same "lemma" or set -- rather like a headword in a dictionary. 
Manual joining
You can simply do this by dragging one entry to another. Suppose your word list has
WANT
WANTED
WANTING
you can simply grab wanting or wanted with your mouse and place it on want
(See choosing lemma file
if you want to join these to a word which isn't in the list)
A lemmatised head entry has a red mark in the left margin beside it. The others you marked will
be coloured as if deleted. The linked entries which have been joined to the head can be seen at
the right. 
Here we see a word list based on 3-word clusters
where originally a good deal had a
frequency of 24, but has been joined to a great deal and a good few and thereby risen to
141. 
If you cannot see all the items you want to join in one screen, you can do the same thing using 
function keys
.
1. Use F5 to mark an entry for joining to another. The first one you mark will be the "head". For the
moment, while you're still deciding which other entries belong with it, the edge of that row will be
marked green. Any entries which you then decide to link with the head (by again pressing F5) will
show they're marked too, in white. (If you change your mind you can press F5 again and the
marking will disappear.)
2. Use F4 to join all the entries which you've marked. The program will then put the joint frequencies
of all the words you've marked with the frequency of the one you marked
first (the head). 
To Un-join
If you select an item which has lemmas visible at the right and press Control/F4, this will unjoin the
entries of that one lemma. To unjoin all lemmatised forms in the entire list, in the menu choose Edit
| Join | Unjoin All.
Automatic joining
192
196
63
63
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
int pageIndex = 2; doc.UpdatePage(page, pageIndex); // Save the PDFDocument. String outputFilePath = Program.RootPath + "\\" Output.pdf"; doc.Save
save pdf rotated pages; how to rotate a pdf page in reader
C# PDF Convert to Tiff SDK: Convert PDF to tiff images in C#.net
Description: Convert to DOCX/TIFF with specified zoom value and save it into stream. Parameters: zoomValue, The magnification of the original PDF page size.
pdf rotate single page; rotate pdf page
191
WordList
© 2010 Mike Scott
There are two methods, a) based on a list, and b) based on a template.
a) File-based joining
You can join up lemmas using a 
text file
which automates the matching & joining
process. The actual processing of the list takes place when you choose the menu option 
Match Lemmas (
) in WordList, Concord or KeyWords. Every entry in your lemma list will
be checked to see whether it matches one of the entries in your word list. In the example, if,
say, am, was, and were are found, they will be stored as lemmas of be. If go and went are
found, then went will be joined to go.
b) Auto-joining
based on a template
To speed up this lemmatisation process, you can auto-join any of the entries in your current
word list which meet your criteria.
Can't read all the lemma forms
Double-click on the Lemmas column as in the shot below,
and a window of Lemma Forms will open up, showing the various components.
See also: Auto-Joining methods
Using a text file to lemmatise
selecting multiple entries
,
Concord lemmatisation
9.11.2
auto-joining lemmas
There are two methods, a) based on a list, and b) based on a template.
a) File-based joining
You can join up lemmas using a 
text file
which automates the matching & joining process. The
192
191
191
192
335
127
192
C# Create PDF from Tiff Library to convert tif images to PDF in C#
Description: Convert to PDF with specified zoom value and save it into stream. DocumentType.PDF. zoomValue, The magnification of the original tiff page size.
how to rotate a page in pdf and save it; how to permanently rotate pdf pages
C# PDF Convert to Word SDK: Convert PDF to Word library in C#.net
Description: Convert to DOCX/TIFF with specified zoom value and save it into stream. Parameters: zoomValue, The magnification of the original PDF page size.
pdf reverse page order online; rotate pdf pages by degrees
192
WordSmith Tools
© 2010 Mike Scott
actual processing of the list takes place when you choose the menu option Match Lemmas (
) in
WordList, Concord or KeyWords. Every entry in your lemma list will be checked to see whether it
matches one of the entries in your word list. In the example, if, say, am, was, and were are found,
they will be stored as lemmas of be. If go and went are found, then went will be joined to go.
b) Auto-joining based on a template
Or you can auto-join any of the entries in your current word list which meet your criteria: the menu
option Auto-Join can be used to specify a string such as S or S;ED;ING and will then go through
the whole word list, lemmatising all entries where one word only differs from the next by having S or
ED or ING on the end of it. (Use ; to separate multiple suffixes.) 
Prefix / Suffix / Infix
By default all strings typed in are assumed to be suffixes; to join prefixes put an asterisk (*) at
the right end of the prefix. If you want to search for infixes (eg. bloody in absobloodylutely
[languages like Swahili use infixes a lot]) put an asterisk at each end.
Examples
S;ED;ING will join  books to book, booked to book and booking to book
*S;*ED;*ING will join  books to book, booked to book and booking to book
UN*;ED;ING will join  undo to do, booked to book and booking to book
*BLOODY* will join  absobloodylutely to absolutely
The process can be left to run quickly and automatically, or you can have it confirm with you
before joining each one. Automatic lemmatisation, like search-and-replace spell-checking, can
produce oddities if just left to run! 
To stop in the middle of auto-joining, press Escape.
Tip
With a previously saved list, try auto-joining without confirming the changes (or choose Yes to
All during it). Then choose the Alphabetical (as opposed to Frequency) version of the list and
sort on Lemmas (by pressing the Lemmas column heading). You will see all the joined entries
at the top of the list. It may be easier to Unjoin
(Ctrl + F4) any mistakes than to confirm
each one...  Finally, sort on the Word and save.
See also: Lemmatisation
9.11.3
choosing lemma file
The point of it…
You may choose to lemmatise all items in the current word-list using a standard text file which
groups words which belong together (be -> was, is, were, etc.). While it is time-consuming
producing the text file the first time, it will be very useful if you want to lemmatise lots of word lists,
and is much less "hit-and-miss" than auto-joining
using a template.
There is an English-language lemma list from Yasumasa Someya at http://www.lexically.net/
downloads/BNC_wordlists/e_lemma.txt
.
190
190
191
193
WordList
© 2010 Mike Scott
How to do it
In the main Controller, Settings | Adjust Settings | Lemma,Match,Stop lists, you will see a screen
like this:
Choose the appropriate button (for Concord, KeyWords or WordList) and type the file name or
browse for it, then Load it. 
The file should contain a plain text list of lemmas with items like this:
BE -> AM, ARE, WAS, WERE, IS
GO -> GOES, GOING, GONE, WENT
WordSmith then reads the file and displays them (or a sample if the list is long). The format allows
any alphabetic or numerical characters in the language the list is for, plus the single apostrophe,
space, underscore. In other words, if you mistakenly put GO = GOES that line won't be included
because of the = symbol.
The actual processing of the list will take place when you compute your word list, key word list or
concordance or when you choose the menu option Match Lemmas (
) in WordList, Concord or
KeyWords. See Match List
for a more detailed explanation, with screenshots. Lemmatising
64
194
WordSmith Tools
© 2010 Mike Scott
occurs before any stop list
is processed.
What if my text files don't contain the headword of the lemma?
Suppose you are matching AM, ARE etc with BE as in the list above, but your texts don't actually
contain the word BE. In that case the tool will insert BE with zero frequency and add AM, ARE etc
as needed.
See also: Lemmatisation
Match List
Stop List
Lemmatisation in Concord
9.12
WordList Index
9.12.1
what is an Index for?
the point of it
1. One of the uses for an Index is to record the positions of all the words in your text file, so that
you can subsequently see which word came in which part of each text. Another is to speed
up access to these words, for example in concordancing. If you select one or more words in
the index and press 
, you get a speedy concordance.
2. Another is to compute "Mutual Information"
scores which relate word types to each other.
3. Or you can use an index to see word clusters
.
4. Finally, an index is needed to generate concgram
searches. 
See also Making an Index List
Viewing Index Lists
Exporting index data
find filenames
for word clusters
WordList Help Contents
WSConcgram
9.12.2
making a WordList Index
The process is just like the one for making a word-list except that after choosing your texts and
ensuring you like the index filename, you choose the bottom button here:
80
190
64
80
125
205
196
11
194
201
203
189
180
11
195
WordList
© 2010 Mike Scott
In this screenshot above, the basic filename is shakespeare_plays: WordSmith will add .
tokens and .types to this basic filename as it works. Two files are created for each index:
.tokens file: a large file containing information about the position of every word token in your text
files.
.types file: knows the individual word types. 
If you choose an existing basic filename which you have already used, WordList will check
whether you want to add to it or start it afresh: 
An index permits the computation of word clusters
and Mutual Information
scores for each
196
205
196
WordSmith Tools
© 2010 Mike Scott
word type. The screenshot below shows the progress bars for an index of the BNC World corpus; on
a modern PC it might work at a rate of about 2.8 million words per minute. The resulting BNC
Words.tokens file was 1.6GB in size and the BNC Words.types file was 26 MB. 
adding to an index
To add to an existing index, just choose some more texts and choose File | New | Index. If the
existing filename is already in use for an index, you will be asked whether to add more or start it
afresh as shown above.
See also Using Index Lists
Viewing Index Lists
WordList Help Contents
.
9.12.3
index clusters
WordList clusters
A word list doesn't need to be of single words. You can ask for a word list consisting of two, three,
up to eight words on each line. To do cluster processing in WordList, first make an index
.
How to see clusters…
Open
the index. Now choose Compute | Clusters.
194
201
180
194
201
Documents you may be interested
Documents you may be interested