77
Controller
© 2010 Mike Scott
read-only; Windows will find a suitable place for wordsmith.ini, usually the root folder of c:\.
The first time you use WordSmith, you will be prompted to Adjust Settings, choose appropriate 
Folders
Text
Characteristics,  Tag
details etc. and enable the Save checkbox, after which
your settings will be saved for future use. You can change settings and save them as often as you
like.
Similarly, on a network you will usually not be allowed to change defaults permanently, as this
would affect other users. Your network administrator should have installed the program so that you
have your own copy of wordsmith.ini, where it may be both read and altered. If WordSmith
Tools finds a copy of wordsmith.ini in that folder it will be able to use your personal
preferences.
5.33
save results
To save your corrected results use Save (Ctrl+F2) in the menu. This saves all the results so you
can return to the data at a later date. You may wish to clean up any deleted items by zapping
, f
irst.
Saved data is in a special  WordSmith Tools format. The only point of it is to make it possible to
use the data again another day. You will not be able to examine it usefully outside the Tools. If you
want to export your data to a spreadsheet, graphics program, database or word processor, etc., you
can do this either by saving as text
or by copying the data to the clipboard
.
save part of the data only
By default, 
and 
save all your data that you haven't zapped
. If you want to save only part
of it, but don't want to zap it to oblivion, choose Copy
.
5.34
search & replace
Some lists, such as lists of filenames
, allow for searching and replacing. 
The point of it
If your text data has been moved from one PC to another, or one drive to another, it will be
necessary to edit all the filenames if WordSmith ever needs to get at the source texts, such as
when computing a concordance from a word list
.)
Search & Replace for filenames
If you are replacing a filename you will see something like this. We distinguish between the path
and the file's individual name, so that for a case like C:\texts\BNC\spoken\s conv\KC2.txt
the filename is  KC2.txt and the path to it is C:\texts\BNC\spoken\s conv.
To correct the path to the file, e.g. if you've moved your BNC texts to drive Q:\my_moved_texts
you might simply replace as shown here 
320
83
88
86
72
313
86
45
80
162
Pdf rotate page and save - rotate PDF page permanently in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Empower Users to Change the Rotation Angle of PDF File Page Using C#
how to rotate page in pdf and save; how to rotate a page in pdf and save it
Pdf rotate page and save - VB.NET PDF Page Rotate Library: rotate PDF page permanently in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
PDF Document Page Rotation in Visual Basic .NET Class Application
pdf save rotated pages; how to rotate one page in a pdf file
78
WordSmith Tools
© 2010 Mike Scott
and all the filenames which contain c:\texts will get Q:\my_moved_texts e.g. C:
\texts\BNC\spoken\s conv\KC2.txt will become Q:\my_moved_texts\BNC\spoken\s
conv\KC2.txt. 
To rename a filename only, change the radio buttons in the middle of the window and the search
and replace operation will ignore the path but replace within the filename only.
Search & Replace for other data
In this case the search & replace isn't of filenames but in the case below in Viewer and Text Aligner,
of the actual text. Like a search
operation, the search operates on the current column of data. 
The context line shows what has been found.
The line below shows what will happen if you agree to the change.
Yes: make 1 change (the highlighted one), then search for the next one
Skip: leave this one unchanged, search for the next one
Yes All: change without any check
79
VB.NET PDF Page Delete Library: remove PDF pages in vb.net, ASP.
this RasterEdge XDoc.PDF SDK, you can simply delete a single page from a PDF document using VB.NET or remove any page from a PDF document and save to local
how to rotate pdf pages and save permanently; rotate individual pdf pages reader
C# PDF Page Insert Library: insert pages into PDF file in C#.net
PDF document files by C# code, how to rotate PDF document page page to a specific location of current PDF file two empty page at 2 (previous to the third page).
save pdf after rotating pages; pdf reverse page order
79
Controller
© 2010 Mike Scott
Skip All: stop searching...
Whole word – or bung in an asterisk
The syntax is as in Concord, so by default a whole word search. To search for a suffix or prefix, use
the asterisk. Thus *ed will find any entry ending in ed; un* will find any entry starting with un.
*book* will find any entry with book in it (book, textbook, booked.)
Word lists can be sorted by suffix: see WordList sorting
.
See also: Searching by Typing
Searching with F12
Accented Characters & Symbols
.
5.35
search by typing
Whenever a column of display is organised alphabetically, you can quickly find a word by typing. As
you type, WordSmith will get nearer. If you've typed in the first five letters and WordSmith has
found a match, there'll be a beep, and the edit window will close. You should be able to see the
word you want by now. 
See also: Edit v. Type-in mode
Searching for a word or part of one
Search & Replace
,
Editing
WordList sorting
5.36
search for word or part of word
All lists allow you to search for a word or part of one, or a number. The search operates on the 
current column of data, though you can change the choice as in this screenshot. 
The syntax is as in Concord. As the example shows, sound* has located the word sounds within
a concordance and shows some of its context. To find again, press OK again....
223
79
79
312
318
79
77
51
223
C# PDF Page Delete Library: remove PDF pages in C#.net, ASP.NET
doc.Save(outPutFilePath); Related APIs (PDFDocument.cs): public override void DeletePage(int pageId). Description: Delete specified page from the input PDF file
rotate pdf pages and save; rotate pdf page few degrees
VB.NET PDF Page Insert Library: insert pages into PDF file in vb.
outPutFilePath As String = Program.RootPath + "\\" Output.pdf" Dim doc1 doc2.InsertPage(page, pageIndex) ' Output the new document. doc2.Save(outPutFilePath
rotate pdf pages individually; rotate pdf page
80
WordSmith Tools
© 2010 Mike Scott
Whole word – or bung in an asterisk
The syntax is as in Concord, so by default a whole word search. To search for a suffix or prefix, use
the asterisk. Thus *ed will find any entry ending in ed; un* will find any entry starting with un.
*book* will find any entry with book in it (book, textbook, booked.)
Word lists can be sorted by suffix: see WordList sorting
.
See also: Searching by Typing
Search & Replace
Accented Characters & Symbols
.
5.37
see filenames
This button enables you to open a new window, displaying the text filename
from which your
current data comes. You can edit these names if necessary (e.g. if the text files have been moved
or renamed.) To do so, choose Replace (
).
Afterwards, if you save the results
, the information will be permanently recorded.
In the case of key word lists, the data comes from a word list. If the word list was based on just one
text file, you'll see the text file name, but if on more than one, you'll see the name of the word list
file itself: to see the original text file names, you could open up the word list and press the
filenames button in that.
See also: finding source files
.
5.38
stop lists
Stop lists are lists of words which you don't want to include in analysis. For example you might
want to make a word list or analyse key words excluding common function words like the, of, was,
is, it
To use stop lists, you first prepare a file, using Notepad or any plain text word processor, which
specifies all the words you wish to ignore. Separate each word using commas, or else place each
one on a new line. You can use capital letters or lower-case as you prefer. You can use a semi-
colon for comment lines. There is no limit to the number of words.
There is a file called stop_wl.stp (in your \wsmith5 folder) which you could use as a basis and
save under a new name. Or just make your own in Notepad and save it with .stp as the file-
extension. If that is difficult, rename the .txt as .stp.
Example
; My stop list for test purposes. 
THE,THIS,IS
IT
WILL
Then select Stop List in the menu to specify the stop list(s) you wish to use. Separate stop lists
223
79
77
312
329
77
320
C# PDF Page Extract Library: copy, paste, cut PDF pages in C#.net
int pageIndex = 2; doc.UpdatePage(page, pageIndex); // Save the PDFDocument. String outputFilePath = Program.RootPath + "\\" Output.pdf"; doc.Save
rotate pages in pdf expert; rotate pages in pdf and save
C# TIFF: How to Rotate TIFF Using C# Code in .NET Imaging
Convert Tiff to Jpeg Images. Convert Word, Excel, PowerPoint to Tiff. Convert PDF to Tiff. Move Tiff Page Position. Rotate a Tiff Page. Extract Tiff Pages.
pdf rotate single page reader; change orientation of pdf page
81
Controller
© 2010 Mike Scott
can be used for the WordList, Concord and KeyWords programs. If the stop list is activated, it is
in effect: that is, the words in it will be stopped from being included in a word list. If you wish always
to use the same stop list(s) you can specify them in wordsmith.ini as 
defaults
.
To choose your stop list, click the small yellow button in the screenshot, find the stop list file, then
press Load. You will see how many entries were correctly found and be shown the first few of them.
With a stop list thus loaded, start a new word list. The words in your stop list should now not
appear in the word list.
continuous
Normally, every word is read in while making the word list and stored in the computer's memory
without checking whether it's the stop list. Eventually the set of words is checked in your stop list
and omitted if it is present. That is much quicker. However, it means that for the most part, any 
statistics
are computed on the whole text, disregarding your stop list. 
If you choose continuous the processing will slow down dramatically since as every word is read in
while making the word list, it will be checked against the stop list and ignored if found. In other
words, every single case of  THE and OF and IS etc. will be looked at as the texts are read in and
sought in your stop list. The effect will be to give you detailed statistics which ignore the words in
the stop lists.
subtract wordlengths in statistics
If you have not chosen continuous processing as explained above, you may want the statistics of
76
213
C# PDF Convert to Tiff SDK: Convert PDF to tiff images in C#.net
Description: Convert to DOCX/TIFF with specified zoom value and save it into stream. Parameters: zoomValue, The magnification of the original PDF page size.
permanently rotate pdf pages; saving rotated pdf pages
C# Create PDF from Tiff Library to convert tif images to PDF in C#
Description: Convert to PDF with specified zoom value and save it into stream. DocumentType.PDF. zoomValue, The magnification of the original tiff page size.
rotate a pdf page; rotate pdf pages
82
WordSmith Tools
© 2010 Mike Scott
your word list to attempt to deal in part with the stop list work done. With this choice, after the word
list is computed, all the statistics concerning the number of types and tokens and 3-letter, 4-letter
words etc. will be adjusted for the overall column (but not for the column for each single text) in
your statistics
See Match List
for a more detailed explanation, with screenshots.
Another method of making a stop list file is to use WordList on a large corpus of text, setting a
high minimum frequency if you want only the high-frequency words. Then save it as a text file. Next,
use the Text Converter to format it, using stoplist.cod as the Conversion file
.
See also: Making a Tag File
Match List
Lemmatisation
.
5.39
suspend processing
As WordSmith works its way through text files, or re-sorting data, you will see a progress window in
the Controller with horizontal bars showing progress. If appropriate there'll be a Suspend button, too.
Pressing this offers 4 choices:
carry on
... as if you had not interrupted anything
stop after this file
Finishing the file means that you can keep track of what has been done and what there wasn't time
for. (How? By examining the filenames in the word list, concordance or whatever you have just been
creating.) 
stop as soon as possible
...useful if you're ploughing through massive CD-ROM files. WordSmith will stop processing the
213
64
278
94
64
192
83
Controller
© 2010 Mike Scott
current file in the middle, but will retain any data it has got so far.
panic stop
The whole Tool (Concord or WordList, or whatever) will close down and some system resources 
memory
may be wasted. The  Controller
will not be closed down.
Press Suspend again to effect your choice.
5.40
text and languages
These settings affect how WordSmith will handle your texts. At the top, you see boxes allowing you
to choose the language family (eg. English) and sub-type (UK, Australia etc.). These choices are
determined by the preferences you have previously set. That is, the expectation is that you only
work with a few preferred languages, and you can set these preferences once and then forget about
them. You do this by pressing the Edit Languages
button.
The choices below may differ for each language:
334
4
6
84
WordSmith Tools
© 2010 Mike Scott
hyphens and  numbers
You can also specify whether hyphens are to count as word separators. If the hyphen box is
checked [X], self-access will be treated as two words.
Should numbers be included in a word-list as if they were ordinary words? If you leave this
checkbox blank, words like $300, 50.3M or 10th will be ignored in word lists, key words,
concordances etc. and replaced by a #. If you switch it on, they will be included.
characters within word
WordSmith automatically includes as valid alphabetical symbols all those determined by the
operating system as alphabetical for the language chosen. So, for English, A to Z and common
accents such as é. For Arabic or Japanese, whatever characters Microsoft have determined count
as alphabetic.
But you may wish to allow certain additional characters within a word. For example, in English, the
apostrophe in father's is best included as a valid character as it will allow processing to deal
with the whole word instead of cutting it off short. (If you change language to French you might not
want apostrophes to be counted as acceptable mid-word characters.) 
Examples: 
'
(only apostophes allowed in the middle of a word)
'%
(both apostophes and percent symbols allowed in the middle of a word)
'_
(both apostophes and underscore characters allowed in the middle of a word)
You can include up to 10. 
If you want to allow fathers' too, check the allow to end of word box. If this is checked, any of
these symbols will be allowed at either end of a word as long as the character isn't all by itself (as
in "  '  "). 
Plain Text/HTML/SGML
Your texts may be Plain Text in format: the default. If they are tagged
in HTML, SGML or XML
you should choose one of the options here. That way, the Tools can make optimum use of
sentence, paragraph and heading markup.
Windows format etc.
Information about Windows character sets
for the language you are working with. 
start & end of heading
For the Tools to count headings, they need to know how to recognise the start and end of one. If
your text is tagged
e.g. with <h1> and </h1>, type <h#> and </h#> in here. (# stands for any
digit, ## for two, etc.) Whatever you type is case sensitive: </H#> is not the same as </h#>. (If
you have HTML
text which is not consistent, using sometimes </h1> and sometimes </H1>,
then use Text Converter
to make your texts consistent).
start & end of section
If these boxes contain eg. <div#> and </div>, the Tools will treat identify sections. Again,
whatever you type is case sensitive.
start & end of sentence
If this space contains the word auto, the Tools will treat sentences as defined
(ending with a full
stop, question mark or exclamation mark, and followed by a capital letter), but if your text is tagged
88
324
312
88
324
7
317
85
Controller
© 2010 Mike Scott
e.g. with <s> and </s>, type those in here. Again, whatever you type is case sensitive.
start & end of paragraph
For the Tools to recognise paragraphs, they need to know what constitutes a paragraph start and/or
end, e.g. a sequence of two <Enter>s (where the original author pressed Enter twice) or an <Enter>
followed by a <Tab>. For that you would type <Enter><Tab>. If your text is tagged
e.g. with
<p> and </p>, you can type the tag in here. Case sensitive, too. 
In many cases you may consider that defining a paragraph end will suffice (considering everything
up to it to be part of the preceding one). Much HTML text does not consistently distinguish between
paragraph starts and ends. 
Note that spoken texts in the BNC use </u> instead of </p>, but you can leave </p> here as
WordSmith will use </u> instead if the text has no </p> in it.
See also: Tagged Text
Stop Lists
Choosing a new language
Processing text in
Chinese etc
.
5.41
window management
The main WordSmith Tools Controller
will be at the top left corner of your screen, half the screen
width and half the screen height in size. Other Tools will appear in the middle. Each Tool main
window will come just below any previous ones. 
Make use of the Taskbar (or Alt-tab, which helps you to switch easily from one window to the next).
"Start another Concord window"?
You will see this if you already have a window of data and press New to start another concordance.
You can have any number of windows open for each Tool, each with different data.
minimising, moving and resizing windows
All windows can be stretched or shrunk by putting the mouse cursor at one edge and pulling. They
can be moved most easily by grabbing the top bar, where the caption is, and pulling, using the
mouse. You can minimise a window: it becomes an icon which you restore by clicking on it. If you
maximise it, it will fill the entire screen of the Tool concerned. These are standard Windows
functions. It's okay to minimise the main Controller
window when using individual Tools.
tile and cascade
You can Tile or Cascade the Tools from the main  WordSmith Tools program.
restore last file
A convenience feature: the last file you saved or retrieved will by default be restored when you re-
enter WordSmith Tools. I've kept it to one only to avoid screen clutter! This feature can be turned off
temporarily via a settings option or permanently in wordsmith.ini (in your
Documents\wsmith5 folder). You can also generally access your last saved result in any Tool by
right-clicking and choosing last file:
88
88
88
80
6
4
4
86
WordSmith Tools
© 2010 Mike Scott
5.42
zap unwanted lines
To restore the correct order to your data after editing it a lot or marking lines for deletion, press the
Zap button (
or Ctrl-Z). This will permanently cut out all lines of data which you have deleted (by
pressing Del) unless you've restored them from deletion (Ins).
In the case of a word list, it will also re-order the whole file in correct frequency order. Any deleted
entries are lost at this stage. Any which have been assigned as lemmas of head words may still be
viewed, before or after saving. However, after zapping, lemmas can no longer be undone.
In the case of a concordance, you may wish the list of filenames to be re-computed to reflect only
the files still referred to in your concordance. To do that, choose Compute | Filenames.
See also : reduce data to N entries
.
71
Documents you may be interested
Documents you may be interested