how to display pdf file in picturebox in c# : Delete text from pdf acrobat control application system web page azure asp.net console Final_algae_biodiesel_report11-part478

108 
 
a.
The searching is Semantic Searching, which enables query creation and improves 
search results by using semantics, the science of meaning in language.  
b.
Quick/Number searching and Boolean searching are available 
c.
Saved Searches saves queries for frequently used searches.  Searches can be saved 
directly from a result set.  Two or more existing Saved Searches can be merge 
d.
Users can create Alerts for later automated searches 
e.
Work files save, organize, annotate and share personalized lists of patents.  Work 
files can save up to 20,000 patent documents.  Users can share Work Files with 
coworkers or clients. 
f.
Data Extract exports key bibliographic fields in common formats 
g.
Notes  feature allows users to make  comments accessible to people across  the 
entire user group 
h.
Searching subsidiary companies is also available.  
III.
Analysis 
a.
Allows analysis of charts and graphs 
b.
Visualization  and  comparison  tools  available.  Two  fields  can  be  selected  to 
analyze the results 
c.
Saved folders can be analyzed.  
Platform Name – PatentLens
I.
General Information  
a.
It is a project of Cambia.  
b.
It includes sequences (DNA, RNA and Protein) extracted from patent documents.  
c.
The platform was last updated may 2, 2010.  
d.
It includes full text of over 8 million patents and applications  
e.
It uses NCBI’s Blast software to search sequences that are specifically listed in 
US.  
f.
Allows sequence searching in specification and claims of patents 
g.
Similarity of sequences is determined by E-value  
h.
This platform is a free resource.  
II.
Data coverage 
1.
US  
2.
EPO  
3.
Australia 
4.
INPADOC  
Delete text from pdf acrobat - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
extract text from pdf file using java; copying text from pdf into word
Delete text from pdf acrobat - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
extract text from pdf java; export text from pdf to word
109 
 
APPENDIX D: Definitions of US Classifications
140
The U.S. Patent Classification System is a categorization of all U.S. patent and other technical 
documents  by  common  subject  matter. Each  subject  matter  division  includes a  class  and  a 
subclass.  The  Manual of  Classification is  an  ordered listing  of  all  the  valid classifications.  
Classes  and  subclasses  have  titles  providing  a  general  description  of  their  contents,  and 
definitions providing a more specific description. A definition may contain an explanation of the 
class or subclass, a glossary, search notes, references to subclasses within a class, and references 
to other classes and subclasses. The U.S. system contains about 450 classes and about 150,000 
subclasses. The classification code is express with 2 numbers separated by a forward slash, for 
example, 435/134. The first number, 435, represents the class of the invention. The number 
following the slash, 134, is the subclass of the invention within the preceding class. Patents will 
always  have both a  class and a subclass.    More  explanation and definitions of U.S. patent 
classifications can be found at, 
http://www.uspto.gov/web/patents/classification/
.  
Classifications assigned to patent documents coded as relevant for this report include:
Class 435: Chemistry: Molecular Biology and Microbiology 
435/006 = Involving nucleic acid 
435/069.1 = Recombinant DNA technique included in method of making a protein or 
polypeptide 
435/134 = Fat; fatty oil; ester-type wax; higher fatty acid (i.e., having at least seven 
carbon atoms in an unbroken chain bound to a carboxyl group); oxidized oil or fat 
435/166 = Preparing hydrocarbon 
435/193 = Transferase other than ribonuclease 
435/252.3 = Transformants (e.g. recombinant DNA or vector or foreign or exogenous 
gene containing, fused bacteria, etc.) 
435/254.2 = Yeast; media therefore 
435/254.22 = Candida 
435/257.2 = Transformants 
435/320.1  =  Vector,  per  se  (e.g.,  plasmid,  hybrid  plasmid,  cosmid,  viral  vector, 
bacteriophage vector, etc.)  
435/325 = Animal cell, per se (e.g., cell lines, etc.); composition thereof; process of 
propagating, maintaining or preserving an animal cell or composition thereof; process 
of isolating or separating an animal cell or composition thereof; process of preparing 
a composition containing an animal cell; culture media therefore 
435/419 = Plant cell or cell line; per se, contains exogenough or foreign nucleic acid 
435/468 = Introduction of a polypeptide molecule into or rearrangement of a nucleic 
acid within a plant cell 
435/471 = Introduction of a polynucleotide molecule into or rearrangement of nucleic 
acid within a microorganism (e.g., bacterial, protozoa, bacteriophage, etc.) 
Class 536: Organic Compounds 
536/023.1 = DNA or RNA fragments or modified forms thereof (e.g., genes, etc.) 
536/023.2 = Encodes an enzyme 
                                                           
 
140
http://www.uspto.gov/web/patents/classification/. 
.NET PDF Document Viewing, Annotation, Conversion & Processing
Redact text content, images, whole pages from PDF file. Annotate & Comment. Edit, update, delete PDF annotations from PDF file. Print.
copy pdf text to word with formatting; copy text from pdf
C# PDF Converter Library SDK to convert PDF to other file formats
Allow users to convert PDF to Text (TXT) file. can manipulate & convert standard PDF documents in other external third-party dependencies like Adobe Acrobat.
pdf text replace tool; extract text from pdf
110 
 
536/023.6 = Encodes a plant polypeptide 
Class 554: Organic Compounds 
554/001 = Fatty compounds having an acid moiety which contains the carbonyl of a 
carboxylic acid, salt, ester, or amide group bonded directly to one end of an acyclic 
chain of at least seven (7) uninterrupted carbons, wherein any additional carbonyl in 
the acid moiety is (1) part of an aldehyde or ketone group, (2) bonded directly to a 
noncarbon  atom  which  is  between  the  additional  carbonyl  and  the  chain,  or  (3) 
attached indirectly to the chain via ionic bonding 
Class 800: Multicellular living organisms and unmodified parts thereof and related processes 
800/278 = Met hod of introducing a polynucleotide molecule into or rearrangement of 
genetic material within a plant or plant part 
800/281  =  The  polynucleotide  alters  fat,  fatty  oil,  ester-type  wax,  or  fatty  acid 
production in the plant 
800/295 = Plant, seedling, plant seed, or plant part, per se 
800/298  =  Higher  plant,  seedling,  plant  seed,  or  plant  part  (i.e.,  angiosperms  or 
gymnosperms) 
800/320.1 = Maize 
C# powerpoint - PowerPoint Conversion & Rendering in C#.NET
documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. PowerPoint to PDF Conversion.
get text from pdf file c#; extract text from pdf c#
C# Word - Word Conversion in C#.NET
Word documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Word to PDF Conversion.
get text from pdf image; copy text from pdf to word with formatting
111 
 
APPENDIX E: Definitions of IPC Classifications 
International Patent Classification System
141
The  World  Intellectual  Property  Organization  (WIPO)  administers  the  International 
Patent  Classification  (IPC)  system.    IPCs  are  organized  hierarchically  and  divide 
technology into eight sections (A through G) with approximately 70,000 subdivisions.   
An IPC is typically  expressed as, for example, C12N 15/82, but may also appear as 
C12N001582. 
The first letter, C, specifies a Section.   
The number following the Section indicator, 12, specifies a Class.   
The letter N specifies a Subclass.   
The number 15 specifies a Main Group.   
The number following the slash, 82, specifies a Subgroup.   
WIPO publishes the authentic IPCs versions in English and French languages.  Chinese, 
Croatian, Czech, Dutch  German,  Hungarian,  Japanese,  Korean,  Polish,  Romanian,  
Russian,  Serbian,  and  Spanish  versions are also available.   
More 
information 
is 
available 
at 
the 
WIPO 
website, 
http://www.wipo.int/classifications/ipc/en/.   
Classification Codes Applicable to this Report
142
Section A
: Human necessities 
A01H: New plants or processes for obtaining them; plant reproduction by tissue 
culture techniques. 
A01H 5/00 Undifferentiated human, animal or plant cells, e.g. cell lines; 
Tissues; Cultivation or maintenance thereof; Culture media therefor  
Section C:
Chemistry; Metallurgy 
C07H: Sugars; derivatives thereof; nucleosides; nucleotides; nucleic acids  
C07H 21/00: Compounds containing two or more mononucleotide units 
having separate phosphate or polyphosphate groups linked by saccharide 
radicals of nucleoside groups, e.g. nucleic acids 
C07H 21/04: with deoxyribosyl as saccharide radical 
C12N:  Micro-organisms  or  enzymes;  compositions  thereof;  propagating, 
preserving,  or  maintaining  micro-organisms;  mutation  or  genetic  engineering; 
culture media  
C12N 1/12: Unicellular algae; Culture media therefor 
C12N 1/13: modified by introduction of foreign genetic material 
C12N 1/19: modified by introduction of foreign genetic material 
C12N 1/20: Bacteria; Culture media therefor 
C12N 1/21: Bacteria; Culture media therefor 
C12N 5/10: Cells modified by introduction of foreign genetic material, 
e.g. virus-transformed cells 
                                                           
 
141
WIPO, http://www.wipo.int/classifications/ipc/en/ (last visited Apr. 24, 2011). 
142
WIPO, http://www.wipo.int/ipcpub/#refresh=page (version 2011.01) (last visited Apr. 24, 2011). 
VB.NET PDF: How to Create Watermark on PDF Document within
create a watermark that consists of text or image (such And with our PDF Watermark Creator, users need no external application plugin, like Adobe Acrobat.
edit pdf replace text; extract pdf text to word
C# Windows Viewer - Image and Document Conversion & Rendering in
standard image and document in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Convert to PDF.
c# read text from pdf; copy pdf text to word with formatting
112 
 
C12N  9/00:  Enzymes,  e.g.  ligases; Proenzymes;  Compositions thereof; 
Processes  for  preparing,  activating,  inhibiting,  separating,  or  purifying 
enzymes 
C12N 9/02: Oxidoreductases 
C12N 9/10: Transferases 
C12N 15/00: Mutation or genetic engineering; DNA or RNA concerning 
genetic engineering, vectors, e.g. plasmids, or their isolation, preparation 
or purification; Use of hosts therefor 
C12N 15/52: Genes encoding for enzymes or proenzymes 
C12N  15/63:  Introduction  of  foreign  genetic  material  using  vectors; 
Vectors; Use of hosts therefor; Regulation of expression 
C12N  15/74:  Vectors  or  expression  systems  specially  adapted  for 
prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora 
C12N 15/82: Use of eukaryotes as hosts for plant cells 
C12P:  Fermentation or enzyme-using process to synthesize a desired chemical 
compound or composition or to separate optical isomers from a racemic mixture  
C12P 5/00: Preparation of hydrocarbons 
C12P  7/64:  Fats;  Fatty  oils;  Ester-type  waxes;  Higher  fatty  acids,  i.e. 
having at  least  seven  carbon  atoms  in  an  unbroken  chain  bound  to  a 
carboxyl group; Oxidised oils or fats 
C12Q:  Measuring or testing processes involving enzymes or micro-organisms; 
compositions or test papers therefor; processes of preparing such compositions; 
condition-responsive control in microbiological or enzymological processes. 
C12Q 1/68: involving nucleic acids 
C# Excel - Excel Conversion & Rendering in C#.NET
Excel documents in .NET class applications independently, without using other external third-party dependencies like Adobe Acrobat. Excel to PDF Conversion.
delete text from pdf with acrobat; can't copy text from pdf
VB.NET PowerPoint: VB Code to Draw and Create Annotation on PPT
other documents are compatible, including PDF, TIFF, MS free hand, free hand line, rectangle, text, hotspot, hotspot more plug-ins needed like Acrobat or Adobe
erase text from pdf; get text from pdf file c#
113 
 
APPENDIX F: Derwent Classifications
143
Description of Derwent Patent Classifications
The  Derwent  World  Patent  Index  (DWPI)  classification  system  categorizes  patent 
documents using a simple classification system for all technologies; consistently applied 
to  all  patents  by  Thomson  Scientific  subject  experts,  enabling  effective  and  precise 
searching in a particular area of technology. 
International Patent Classification (IPC) is an internationally recognized classification 
system controlled by the World Intellectual Property Organization (WIPO) and assigned 
to patent documents by various patent offices. 
Where possible Thomson indicated next to the class the equivalent IPC in an abbreviated 
form (e.g., A47, F23-5).  However, this should be used only as a guide since there are 
areas where the DWPI classes are assigned intellectually by Thomson’s subject experts, 
and no strict correspondence is claimed. 
Classification Codes (applicable to this report)
A94:
Semi-finished materials – fibres, films, foams. 
This is a subclass of A8/9 – (Polymers and Plastics) Applications. 
A97:
Miscellaneous  goods  not  specified  elsewhere  –  including  papermaking, 
gramophone records, detergents, good and oil well applications. 
This is a subclass of A8/9 – (Polymers and Plastics) Applications. 
B02:
Fused ring heterocyclics. 
This is a subclass of B- Pharmaceuticals. 
B04:
Natural products and polymers.  Including testing of bodily fluids (other than blood 
typing or cell counting), pharmaceuticals or veterinary compounds of unknown structure, 
testing of microorganisms  for pathogenicity, testing  of chemicals for mutagenicity or 
human toxicity and fermentative production of DNA or RNA.  General compositions. 
This is a subclass of B- Pharmaceuticals 
B05:
Other  organics  –  aromatics,  aliphatic,  organo-metallics,  compounds  whose 
substituents vary such that they would be classified in several of B01 – B05. 
This is a subclass of B- Pharmaceuticals 
C03:
Other organic compounds, inorganic compounds and multi-component mixtures.  
Polymers and proteins. 
This is a subclass of C – Agricultural Chemicals. 
C06:
Biotechnology – including plant genetics and veterinary vaccines. 
This is a subclass of C – Agricultural Chemicals. 
D13:
Other  foodstuffs  and  treatment  –  including  preservation  of  food,  milk,  milk 
products,  butter  substitutes,  edible  oils  and  fats,  non-alcoholic  beverages,  artificial 
sweeteners, food additives and animal feed. 
This is a subclass of D1 – Food and Fermentation. 
D16:
Fermentation  industry  –  including  fermentation  equipment,  brewing,  yeast 
production,  production  of  pharmaceuticals  and  other  chemicals  by  fermentation, 
                                                           
 
143
Derwent World Patent Index
, T
HOMSON 
C
ORPORATION
http://science.thomsonreuters.com/m/pdfs/mgr/derwentclass.pdf. 
114 
 
microbiology, production of vaccines and antibodies, cell and tissue culture and genetic 
engineering. 
This is a subclass of D1 – Food and Fermentation. 
D21: 
Preparations for dental or toilet purposes – including filling alloys, compositions for 
dentures or dental impressions, anti-caries chewing gum, plaque disclosing compositions, 
toothpastes,  cosmetics,  shampoos,  topical anti-sunburn  compositions  and  toilet  soaps 
(A61K). 
This is a subclass of D2 – Cosmetics, Disinfectants and Detergents. 
A61K is the corresponding IPC. 
D23:
Oils, fats and waxes – including fatty acids, essential oils, but excluding butter 
(substitutes) and montan wax (C11B, C). 
This is a subclass of D2 – Cosmetics, Disinfectants and Detergents. 
C11b, C are the corresponding IPCs. 
E13:
Heterocyclics 
This is a subclass of E1 – General Organic. 
E15:
Alicyclics. 
This is a subclass of E1 – General Organic. 
E17: 
Other aliphatics 
This is a subclass of E1 – General Organic. 
E19:
Other organic compounds general – organic compounds of unknown or indefinite 
structure; general mixtures of many types; organic reactions (e.g. nitration, resolution) 
when applied generally. 
This is a subclass of E1 – General Organic. 
E36:
Dye precursors excluding E21-E, E24-B. 
This is a subclass of E3 – General Inorganic 
G02:
Inks, paints, polishes – polymer-based paints and inks are also classified in Section 
A (C09D, F, G). 
This is a subclass of G – Printing, Coating, and Photographic. 
C09D, F, G are corresponding IPCs. 
H04:
Petroleum  processing  –  including  treating,  cracking,  reforming,  gasoline 
preparation – biosynthesis based on hydrocarbon feedstocks is included (C10G). 
This is a subclass of H – Petroleum. 
C10G is the corresponding IPC. 
H06:
Gaseous  and  liquid  fuels  –  including  pollution  control.    Chemical  aspects  of 
catalytic exhaust systems for cars are included as well as liquid or gaseous fuels of non-
petroleum  origin,  e.g.  methanol  or  ethanol-based  fuels.    Combustion  improvement 
additives for liquid fuels are included (C10L). 
This is a subclass of H – Petroleum. 
C10L is the corresponding IPC. 
H07:
Lubricants  and  lubrication  –  this  excludes  self-lubricating  surfaces  e.g.  PTFE 
coated surfaces and lubrication systems in general.  The section includes lubricants of 
non-petroleum origin e.g. silicone oils (C10M). 
This is a subclass of H – Petroleum. 
C10M is the corresponding IPC. 
H09: 
Fuel products not of petroleum origin – excluding coal handling, preparation or 
mining, but including coking, briquetting, peat processing synthesis, gas production, coal 
115 
 
gasification.    Combustion  improvement  additives  for  coal,  peat  and  other  non-
hydrocarbon based fuels are included in this Section together with coal liquefaction and 
desulphurisation. 
This is a subclass of H – Petroleum. 
P13:
Plant culture, dairy products (A01G, H, J). 
This is a subclass of P1 – Agriculture, Food, Tobacco. 
A01G, H, J are the corresponding IPCs. 
P14:
Animal care (A10K, L, M) 
This is a subclass of P1 – Agriculture, Food, Tobacco. 
A01K, L, M are the corresponding IPCs. 
 
116 
 
APPENDIX G: Patent Families 
“If there are several applications or publications for an individual invention (in other countries) 
claiming the same priority or priorities, we talk about a “patent family.”  All of these “family 
members” are related to one another by common priority numbers with associated priority dates. 
The concept of the patent family first emerged through the Paris Convention on the Protection of 
Intellectual Property in 1883, while automated systems enabling patent family searching became 
available through the establishment of the IIB in The Hague in 1947and INPADOC in Vienna in 
1972.  Since then, patent searching has evolved due to exponential improvements in computing 
and communication technology. 
The term patent  family  can be  defined in a  number  of  ways depending on the relationship 
between  a  patent  document  and  its  priority  or  priorities  within  the  meaning  of  the  Paris 
Convention.  The differences only become obvious when the structure of a patent application is 
complex, i.e. when applications are filed in several countries.  Such applications may cite various 
earlier applications as priorities, or the diverse patent offices involved in the grant process may 
accept or refuse different patent claims.  This results in patents which have different scopes of 
protection. 
An important point when using any database to retrieve information on patent families is that 
there is never any guarantee that you will find all the corresponding patent documents that exist.  
Database producers do what they can to ensure completeness, but they can never guarantee it.”
144
The “Extended” (INPADOC) Patent Family 
“The biobliographic and legal status databases form the basis of the EPO’s raw data resources 
(INPADOC).  In February 2008 the biobliographic data included about 60 million bibliographic 
data sets from almost 80 different countries.  The legal status database contains a collection of 
more than 50 million legal events from 48 countries. 
From the beginning, the concept was to cover as many countries and as many publication levels 
as possible.  One of the strongest motives for the integration of INPADOC into the EPO was the 
wish  to  combine  the  particular  strengths  of  INPADOC  with  the  EPO’s  existing  in-house 
biobliographic database, “DOC-DB.” 
Following integration of the two databases in the 1990s, the raw data behind both databases is 
now the same.  And since esp@cenet draws on the same pool of data as raw data resources 
(INPADOC) and DOC-DB, it contains the same documentation. 
However, the philosophy of the “extended” (INPADOC) patent family is quite different, and so 
are the results of family searches.  Unlike the “also published as” feature in esp@cenet, which 
only shows “equivalents,” i.e. almost identical documents, an INPADOC family search should 
retrieve all documents relating in any way to the root document. 
                                                           
 
144
E
UROPEAN 
P
ATENT 
O
FFICE
Patent Families
(Feb. 29, 2008), http://www.epo.org/patents/patent-
information/about/families.html. 
117 
 
Features of INPADOC 
When  using  INPADOC  via  one  of  the  commercial  database  host  services,  it  bears  all  the 
esp@cenet features, plus the following: 
Standardization of applicant and inventor names 
References  to  abstracts  from  Chemical  Abstracts  and  Thomson  Scientific 
Abstracts are made within the patent family 
By including the legal  status database  additional information is  available  and 
additional family links can be established 
National  application  numbers,  international  application  numbers and domestic 
relations are included in the family search 
For both of the EPO’s raw data resources (INPADOC) and esp@cenet, even where no priority 
has been claimed by the patent application, artificial or “intellectual” links are built in systematic 
way for the complete PCT minimum documentation.  The same is done for older documents 
(pre-1968) for which the priority information is not complete. 
Definition of the “extended” (INPADOC) patent family 
All the documents directly or indirectly linked via a priority document belong to one patent 
family.  In the case shown below, documents D1 to D5 belong to the same patent family, P1. 
FAMILY P1 
Document D1  Priority P1 
Document D2  Priority P1 
Priority P2   
Document D3  Priority P1 
Priority P2   
Document D4   
Priority P2  Priority P3 
Document D5   
Priority P5 
As mentioned above, national patent application numbers, international application numbers and 
domestic relations are included in the family search. 
In the “extended” (INPADOC) patent family, it does not matter where you start the search.  It 
can be an application number, a priority application number or a publication number. 
If the search starts with a publication number, all application numbers, domestic application 
numbers, priority numbers and international application numbers are used to retrieve additional 
documents.  For all documents found in this step, step one is repeated.  This iteration process 
ends only when no more new documents can be found. 
Raw  data  resources  (INPADOC)  also  use  some  additional  sophisticated  rules  for  certain 
countries,  for  example,  if  publication  numbers  are  used  instead  of  priority  numbers  in  the 
original documents.  This happened rather frequently for older documents, where the priority 
claims were not treated as carefully as they are now. 
Documents you may be interested
Documents you may be interested