157
KeyWords
© 2010 Mike Scott
Choose Word Lists
Colours
Database
Folders
Fonts
Keyboard Shortcuts
Printing
Re-sorting
Exiting
Tips
KeyWords advice
Window management
Definitions
General Definitions
Key-ness
Key key-word
Associate
See also : WordSmith Main Index
8.3
ordinary two word-list analysis
The usual kind of KeyWords analysis. It compares the one text file (or corpus) you're chiefly
interested in, with a reference corpus based on a lot of text. In the screenshot below we are
interested in the key words of deer hunter story and we're using BNC world as the
reference corpus to compare with.  
Choose Word Lists
In the dialogue box you will choose 2 files. The text file in the box above and the reference corpus
file in the box below. 
161
40
162
320
56
328
57
174
71
167
85
317
165
165
158
2
Pdf save rotated pages - rotate PDF page permanently in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Users to Change the Rotation Angle of PDF File Page Using C#
rotate pdf pages by degrees; how to rotate pdf pages and save
Pdf save rotated pages - VB.NET PDF Page Rotate Library: rotate PDF page permanently in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
PDF Document Page Rotation in Visual Basic .NET Class Application
save pdf rotated pages; rotate pdf page and save
158
WordSmith Tools
© 2010 Mike Scott
See also How Key Words are Calculated
KeyWords Settings
8.4
associate definition
An "associate" of key-word X is another key-word (Y) which co-occurs with X in a number of texts. It
may or may not co-occur in proximity to key-word X. (A collocate would have to occur within a given
distance of it, whereas an associate is "associated" by being key in the same text.)
For example, in a key-word database of Guardian newspaper text, wine was found to be a key word
in 25 out of 299 stories from the Saturday "tabloid" page, thus a 
key key word
in this section.
The top associates of wine were: wines, Tim, Atkin, dry, le, bottle, de, fruit, region, chardonnay, red,
producers, beaujolais.
It is strikingly close to the early notion of "collocate".
Association operates in various ways. It can be strong or weak, and it can be one-way or two-way.
For example, the association between to  and fro  is one-way (to  is nearly always found near fro  but
it is rare to find fro  near to ).
See also: Definition of Key Word
Associates
Definitions
Mutual Information
168
176
165
165
159
317
205
VB.NET TIFF: Rotate TIFF Page by Using RaterEdge .NET TIFF
specific formats are: JPEG, PNG, GIF, BMP, PDF, Word (Docx Save the rotated page(s) to new a TIFF Multiple image formats support for saving rotated TIFF page(
pdf reverse page order; pdf expert rotate page
VB.NET Image: Image Rotator SDK; .NET Document Image Rotation
VB.NET image rotator control SDK allows developers to save rotated image as are dedicated to provide powerful & profession imaging controls, PDF document, tiff
rotate pdf page few degrees; how to change page orientation in pdf document
159
KeyWords
© 2010 Mike Scott
8.5
associates
"Associates" is the name given to key-words associated with a key key-word
.
The point of it…
The idea is to identify words which are commonly associated with a key key-word, because they
are key words in the same texts as the key key-word is. An example will help.
Suppose the word wine is a key key-word in a set of texts, such as the weekend sections of
newspaper articles. Some of these articles discuss different wines and their flavours, others concern
cooking and refer to using wine in stews or sauces, others discuss the prices of wine in a context of
agriculture and diseases affecting vineyards. In this case, the associates of wine would be items
like Chardonnay, Chile, sauce, fruit, infected, soil, etc.
The listing shows associates in order of frequency. A menu option allows you to re-sort them.
Settings
You can set a minimum number of text files for the association procedure, in the database settings
:
Minimum texts
The screenshot settings will only process those key-key-words which appear in at least 3 text files.
Statistic
Choose the mutual information statistic
you prefer, apart from Z score which uses a span (here
we're using the whole text).
Minimum strength
This will only show associates which reach at least the strength in the statistic set here, eg. 3.000.
This screenshot shows the most frequent associates in the right-hand column of the main keywords
166
176
206
C# TIFF: How to Rotate TIFF Using C# Code in .NET Imaging
VB.NET How-to, VB.NET PDF, VB.NET Word, VB Tiff page, like sorting and saving the rotated Tiff page 0); page.Rotate(RotateOder.Clockwise90); doc.Save(@"C:\rotate
how to rotate one pdf page; reverse page order pdf online
How to C#: Rotate Image according to Specified angle
VB.NET How-to, VB.NET PDF, VB.NET Word, VB.NET Excel, VB.NET PowerPoint, VB.NET Tiff, VB.NET Imaging, VB.NET OCR, VB.NET Twain, VB Save the rotated image to
how to save a pdf after rotating pages; pdf rotate single page
160
WordSmith Tools
© 2010 Mike Scott
data base window.
To see the detailed associates, double-click your chosen term in the KW column:
See also: definition of associate
related clusters
.
158
167
VB.NET Imaging - Data Matrix Plug-in SDK Control
Generated Data Matrix barcode image can be freely rotated, resized and code page.AddImage(image, New PointF(100F, 100F)) docx.Save("C:\\Sample_Barcode.pdf").
pdf page order reverse; how to rotate all pages in pdf in preview
C# HTML5 Viewer: Load, View, Convert, Annotate and Edit OpenOffice
documents, CSV file and Text file are allowed to be rotated. PowerPoint (.ppt, .pptx) on webpage, Convert CSV to PDF file online Users can save annotations to
rotate single page in pdf reader; pdf rotate one page
161
KeyWords
© 2010 Mike Scott
8.6
choosing files
Current Text Wordlist
In the upper box, choose a word list file. 
To choose more than 1 word list file, press Control as you click to select non-adjacent lists, or
Shift to select a range. 
This box determines which word-list(s) you're going to find the key words of.
Reference Corpus Wordlist
The the box below, you choose your Reference Corpus
List. (This can be set permanently in
the main Controller Settings).
No word-lists visible
If you can't see any word lists in the displays, either change folders until you can, or go back to
the WordList tool and make up at least 2 word lists: this procedure requires at least two before it
can make a comparison.
8.7
clumps
"Clumps" is the name given to groups of key-words 
associated
with a 
key key-word
.
The point of it (1)…
The idea here is to refine associates by grouping together words which are found as key in the
same sub-sets of text files. The example used to explain associates will help.
Suppose the word wine is a key key-word in a set of texts, such as the weekend sections of
newspaper articles. Some of these articles discuss different wines and their flavours, others
concern cooking and refer to using wine in stews or sauces, others discuss the prices of wine in a
context of agriculture and diseases affecting vineyards. In this case, the associates of wine would
be items like Chardonnay, Chile, sauce, fruit, infected, soil, etc. The associates procedure shows
334
159
166
VB.NET Word: VB.NET Code to Rotate Word Page Within .NET Imaging
Here, we can recommend you VB.NET PDF page rotating tutorial and multi any original quality during or after the Word page rotating; Save the rotated Word page
rotate pdf pages; pdf rotate just one page
VB.NET Image: How to Process & Edit Image Using VB.NET Image
permanently? A 2: This VB.NET image editor control SDK allows developers process target image file and save edited image as new file.
rotate all pages in pdf file; rotate individual pages in pdf reader
162
WordSmith Tools
© 2010 Mike Scott
all such items unsorted. 
The clumping procedure, on the other hand, attempts to sort them out according to these different
uses. The reasoning is that the key words of each text file give a condensed picture of its
"aboutness", and that "aboutnesses" of different texts can be grouped by matching the key word
lists. Thus sets of key words can be clumped together according to the degree of overlap in the key
word lexis of each text file. 
Two stages
The initial clumping process does no grouping : you will simply see each set of key-words for
each text file separately. To 
group clumps
, you may simply join those you think belong
together (by dragging), or regroup with help by pressing 
.
The listing shows clumps sorted in alphabetical order. You can re-sort by frequency (the number of
times each key word in the clump appeared in all the files which comprise the clump).
See also: 
definition of associate
regrouping clumps
8.8
concordance
With a key word or a word list list on your screen, you can choose Compute and 
to call up a concordance of the currently selected word(s). The concordance will search for the
same word in the original text file that your key word list came from.
The point of it…
is to see these same words in their original contexts.
8.9
creating a database
To build a key words database, you will need a set of key word lists. For a decent sized database,
it is preferable to build it like this:
1. Make a batch
of word lists.
2. Use this to make a batch
of keyword lists. Set "faster minimal processing" on as in this
shot, so as to not waste time computing plots etc.
174
158
174
30
30
163
KeyWords
© 2010 Mike Scott
3. Now, in KeyWords, choose New | Database
This enables you to choose the whole set of key word files. 
Note that making a database means that only positive
key words will be retained.
In the Controller KeyWords settings
you can make other choices: 
minimum frequency for database
If you set this to 5 you will only use for the database any KWs which appear in 5 or more texts
min. KWs per text
If this is set to 10, any KW results files which ended up with very few positive KWs will be ignored.
168
176
164
WordSmith Tools
© 2010 Mike Scott
See also: associates
.
8.10
example of key words
You have a collection of assorted newspaper articles. You make a word list based on these
articles, and see that the most frequent word is the. Among the rather infrequent words in the list
come examples like hoppingmodem, squatter, grateful, etc.
You then take from it a 1,000 word article and make a word list of that. Again, you notice that the
most frequent word is the . So far, not much difference. 
You then get KeyWords to analyse the two word lists. KeyWords reports that the most "key"
words are: squatter, police, breakage, council, sued, Timson, resisted, community.
These "key" words are not the most frequent words (which are those like the ) but the words which
are most unusually frequent in the 1,000 word article. Key words usually give a reasonably good
clue to what the text is about.
Here is an example from the play Othello.
159
165
KeyWords
© 2010 Mike Scott
See also: word-lists with tags as prefix
8.11
key key-word definition
A "key key-word" is one which is "key" in more than one of a number of related texts. The more
texts it is "key" in, the more "key key" it is. This will depend a lot on the topic homogeneity of the
corpus being investigated. In a corpus of City news texts, items like bankprofitcompanies are
key key-words, while computer will not be, though computer might be a key word in a few City news
stories about IBM or Microsoft share dealings.
Requirements
To discover "key key words" you need a lot of text files (say 500 or more), ideally fairly related in
their topics, which you make word-lists of (it's much faster doing that in a batch), and then you have
to compute key word-lists of each of those, all of which go into a database. It is all explained under 
creating a keywords database
.
See also: How Key Words are Calculated
Definition of Key Word
Creating a Database
,
Definitions
8.12
key-ness definition
The term "key word", though it is in common use, is not defined in Linguistics. This program
identifies key words on a mechanical basis by comparing patterns of frequency. (A human being,
on the other hand, may choose a phrase or a superordinate as a key word.)
A word is said to be "key" if
a)
it occurs in the text at least as many times as the user has specified as a Minimum
Frequency
b)
its frequency in the text when compared with its frequency in a reference corpus is such
that the statistical probability as computed by an appropriate procedure
is smaller than or
equal to a p value
specified by the user.
positive and negative keyness
224
162
168
165
162
317
168
172
166
WordSmith Tools
© 2010 Mike Scott
A word which is positively key occurs more often than would be expected by chance in
comparison with the reference corpus.
A word which is negatively key occurs less  often than would be expected by chance in
comparison with the reference corpus.
typical key words
KeyWords will usually throw up 3 kinds of words as "key". 
First, there will be proper nouns. Proper nouns are often key in texts, though a text about racing
could wrongly identify as key, names of horses which are quite incidental to the story. This can be
avoided by specifying a higher Minimum Frequency.
Second, there are key words that human beings would recognise. The program is quite good at
finding these, and they give a good indication of the text's "aboutness". (All the same, the program
does not group synonyms, and a word which only occurs once in a text may sometimes be "key"
for a human being. And KeyWords will not identify key phrases unless you are comparing word-
lists based on word clusters
.)
Third, there are high-frequency words like because or shall or already. These would not
usually be identified by the reader as key. They may be key indicators more of style than of
"aboutness". But the fact that KeyWords identifies such words should prompt you to go back to
the text, perhaps with Concord (just choose Compute | Concordance 
), to investigate why such
words have cropped up with unusual frequencies.
See also: How Key Words are Calculated
Definition of Key Key-Word
Definitions
,
KeyWords Settings
8.13
KeyWords database
(default file extension .KDB)
The point of it…
The point of this database is that it will allow you to study the key-words which recur often over a
number of files. 
For example, if you have 500 business reports, each one will have its own key words. These will
probably be of two main kinds. There will be key-words which are key in one text but are not
generally key (names of the firms and words relating to what they individually produce); and other,
more general words (like consultant, profit, employee) which are typical of business
documentation generally. Or you may find that I, you, should etc. come to the top if your text
files are ones which are much more interactive than the reference corpus texts. 
By making up a database, you can sort these out. The ones at the top of the list, when you view
them, may be those which are most typical of the genre in some way. We might call the ones at
the top "key-key words" and the list is at first ordered in terms of "key key-ness", but those at the
bottom will only be key in a few text files. You can of course toggle it into alphabetical order and
back again.
You can set a minimum number of files that each word must have been found to be key in, using 
Adjust Settings | KeyWords | Database
.
336
168
165
317
176
162
Documents you may be interested
Documents you may be interested