The Adelaide Text Analysis Tool explained
Concordancing software developed at 
The University of Adelaide, Australia.
AdTAT is an easy-to-use, cross-platform tool capable of working with
collections of written text (corpora) in the following ways. 
It can conduct basic word and phrase searches. 
It can conduct associated word and phrase searches.
It can provide frequency lists of words appearing 
both left and right of search terms.
It can print and save results.
It can assist you in constucting corpora. 
Corpora built with AdTAT T can be saved to disk for later use.
The following instructions make the software very simple to use, and
feature many screen-shots to illustrate a step-by-step introduction to
both the software and the concordancing process.
Minimum requirements: AdTAT T will run in Windows 2000 or later,
Macintosh OS 10.4 or later, but requires Java version 1.5 installed.
Minimum RAM required is 512MB, but 1 GB RAM is recommended.
Acknowlegements:The development of this software was funded 
by a University of Adelaide Teaching Development Grant awarded to
the Faculty of Sciences in 2007. 
The development team consisted of Dr Jennifer Watling, 
Margaret Cargill, Dr Ian Green, Ray Adams and Andrew Hall.
Table of Contents
Opening a file or corpus  . . . . . . . . . . . . . . . . . . . . . . . . .1 
Searching for a word . . . . . . . . . . . . . . . . . . . . . . . . . . . .3 
Search Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .3 
Refining your search results . . . . . . . . . . . . . . . . . . . . . .4 
Controlling the search term  . . . . . . . . . . . . . . . . . . . . . . . . . .4 
Controlling the output . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4 
Associated Word Search . . . . . . . . . . . . . . . . . . . . . . . . .5 
Working with results . . . . . . . . . . . . . . . . . . . . . . . . . . . .6 
Making a corpus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7 
Preparing text for concordancing . . . . . . . . . . . . . . . . . . . . . .7 
PDF documents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .8 
Editing text from PDF documents . . . . . . . . . . . . . . . . . . . . . .9 
Not all PDFs can be easily copied  . . . . . . . . . . . . . . . . . . . . .9
How to use
The Adelaide Text Analysis Tool explained
Opening a file or corpus
To use this software you will need a corpus, or collection of text. A corpus can be a
single text file or a group of text files (.txt format). When you have some text for your
corpus, open the AdTAT T package to begin. You should see a screen like this:
This will take you to
an Open File window.
You can navigate to
the place on your
computer’s drive
where you have
saved a corpus of text
ready to explore with
the software. 
Double-click on a
folder to open it.
Click the Load
You can also choose a
single folder which
contains a number of
text files. 
Make your selection
and click the Load
File(s) button at the
bottom of the Open
File window.
Corpus details will
then appear in the
Corpus description
You can enter
a name or
here if you
want to save
the corpus (in
File Menu) for
later use. This
is optional.
You can choose a
single file by clicking
on the filename. 
You can select a
number of files within
a folder by holding
down the Control key 
(Command key on a
Macintosh) as you
select files.
Decide whether you
want to search a
single text file, several
files, or a folder
containing a number
of files.
The Adelaide Text Analysis Tool explained
Searching for a word
One of the simplest functions of AdTAT T is a basic word search. This software will
search a loaded corpus, finding every occurrence of the search term to show you
other words that appear around it: the collocatesused by the writers of the text in your
This process helps you to
see which words are
commonly grouped
together (collocates) in
the text(s) being
Search Results
If your keyword is found,
the program will generate
a concordance list. 
Enter the word you wish
to search for (called a
search termor keyword)
and click the 
Basic Searchbutton.
Choose the Basic
Searchtab, and you will
see a window like this:
Select a concordance and
this panel shows where
the word appears in the
source text, giving the
original context.
The Adelaide Text Analysis Tool explained
Refining your search results
Controlling the search term
AdTAT can search for phrases as well as words.
You can also specify parts of words you want to find:
a string that starts with, ends with or containsthe
characters that you enter.
This example
shows the results
of a search for all
words that
contain “differ”.
Controlling the output
In the Basic Search window, you can also
change the Line width, allowing you to see
more of each line of text in the concordances.
The width default is 60 characters but
sometimes it is useful to see more of the text
surrounding your keyword.
Searches for common words can find too many
results, causing confusion and making it hard to
see useful examples. If a search results in too
many concordance examples of the keyword,
try limiting your attention to a 
smaller number by changing the 
Maximum concordancessetting.
You can change the way concordances are
sorted, depending on whether you want to see
collocates which appear to the left or right of
the keyword. Pull down the Sort typemenu to
change this setting.
The Adelaide Text Analysis Tool explained
Associated Word Search
An Associated Word Search finds occurrences of
two words or phrases which are close together but
not necessarliy alongside each other.
This function is available by selecting the
Associated word searchtab and is useful for
finding or demonstrating words that may be
grammatically linked but do not necessarily appear
side by side in a sentence. Examples of such
searches might be those for terms like
“discuss” [something] … “with”, or “not”
[something], “but” [something else].
Enter both search terms and click the
Associated Word Search button.
This example shows results of a search for
“not” with the Associated term, “but”:
By default, the lines of output are numbered like
some of the examples in these instructions,
making it easier to refer to specific concordances
in notes and discussions. If you do not want the
lines numbered, click to remove the tick 
from the box marked Numbering.
The Adelaide Text Analysis Tool explained
By default, the software displays collocates which
appear alongside the keyword. If you want to pay
attention to words which are 2, 3, or 4 words away
from the keyword, this can be set using the
Collocate distance from keywordsetting.
The Adelaide Text Analysis Tool explained
Working with results
You can choose to remove a
concordance from your search results by
selecting the line, then clicking the
Delete Concordancebutton.
The frequency of collocates can be
found by clicking the Displaybutton in
the Collocates frequency box below your
search results. A search can be made for left or
right collocates by changing the Sort Type
selection. After an Associated Word Search,
collocates of the primary search term are
displayed, not collocates of the associated term.
The example here shows the right collocates for
the word “human” found in a sample corpus of
business writing, after a Basic Word Search.
Frequencies are by default sorted by frequency,
but you can click on the column heading, Word, to
re-sort the list alphabetically by the words listed.
Note: A word frequency listfor the entire corpus
can be found by pulling down the Corpus menu
and selecting Word Frequency. This allows you to
see the kind of vocabulary most commonly used in
your corpus.
Clicking the Save Resultsbutton below the
concordance pane will allow you to save the
current seach result to disk for later reference.
Clicking the Print Results
button will output the
current search result to
your computer’s default
The Adelaide Text Analysis Tool explained
Making a corpus
The best way to use the concordancing process is first to gather a collection of
articles which are relevant to the kind of writing you want to investigate. If you want to
examine research articles in a particular discipline, for example, a useful corpus would
consist of published articles from that discipline. This would allow you to search for
language features that are commonly used in this kind of writing.
The size of a corpus depends on the searches you intend doing. There are drawbacks
to having too little text in your corpus as you may not find enough examples of little-
used terms and expressions. Similarly, a corpus which is too large can result in too
many examples, especially of common words, to allow an easy evaluation of
language features. 
In trials of concordancing software during the development of this package, it was
found that about 20 published journal articles, totalling around 100,000 words, made a
suitable corpus for examining the terms and language features used in writing in
particular disciplines of science. 
The following steps will help you to contruct your own corpus quickly and easily:
Make sure the documents you want to use are written in current English, with
standard usage of prepositions, articles, verb tenses and other grammatical
features. This requirement can be covered by selecting articles for which at
least some of the authors are likely to be “native speakers” of English, and
ensuring that the articles are from a reputable source – check author and
publisher information, as well as the text itself, for guidance on this.
Obtain electronic copies of the articles and save only the text (sentences and
paragraphs, no page numbers, headers or footers, tables and figures), and
save them as text files (.txt format). Your sources may be web pages, PDF
documents or word processor files. See the following section, Preparing text
for concordancing, for more details on coverting text from these sources.
Save all the .txt files in a single folder on your computer.
Preparing text for concordancing
If you receive text in the form of a Microsoft
Word document, simply open the file and
save it as a ‘text only’ file. This will give it a ‘.txt’ extension. It should be saved in a
folder that you intend to use as your corpus.
If you are copying text from web pages, select all the text, copy and paste
immediately into a word processor document. If you are using a hard copy, you need
to scan the document and save it as a text only document.
