c# pdf library mit : Add metadata to pdf application Library tool html asp.net azure online wipo_pub_9464-part696

40 
Occasionally, organizations will look to move into new markets, or enter new technological areas that 
they did not have direct experience in previously. When this happens a PLR can provide key 
intelligence on the top players, inventors, and technology sub-categories associated with the area of 
interest. Armed with this data companies can determine if they will develop new technologies or seek 
to acquire technology from others. 
PLRs tend to be technologically focused in scope, as opposed to competitor focused, and are well 
suited for providing a background collection of insights associated with a particular area. Once an 
initial understanding is gained, ongoing monitoring can also be established using the PLR as a 
foundation. 
5.1.2.3 – Mergers and acquisitions 
Technology savvy organizations will look at innovative benefit and fit, in addition to the more 
traditional economic and market driven factors, when deciding on whether to acquire, or merge with 
another company. A technology based due diligence assessment is necessary to ensure that two 
groups will be compatible with one another, and is often used to determine how much technological 
overlap there is between them. 
It is not unusual to find that, while two organizations are working in the same technological area, they 
are taking different approaches to solving key issues. In this case, the companies are complimentary 
to one another, and a stronger argument can be made for justifying a merger, especially when a 
combination will cover all major methods for deploying a technology. 
Under different circumstance, it is sometimes discovered that an acquisition would provide redundant 
capabilities that are already owned by the acquiring company. This scenario can occur with large, 
multi-national and divisional companies, or ones that become involved with several mergers, or 
acquisitions in a short time frame. 
In any of these scenarios PLRs are often generated to provide focused insight on the organizations 
involved and project how the combined resources will compare to the other companies involved in a 
technology area. 
5.2 – Motivations for generating Patent Landscape Reports 
Having looked at the reasons why organizations are interested in the analysis of patent information, 
and its association with strategic decision-making, it is also important to look at the aspects of PLRs, 
in particular, and how they can be maximized to achieve this benefit. 
In chapter 8, individual sections and specific analytics will be addressed, but in this section the value 
associated with the reports, especially to the client, typically a technologically based, decision maker, 
are addressed. 
5.2.1 – Who is the report intended for? 
In order for a PLR to be impactful it has to be read by a decision maker in the first place. The two 
primary considerations in determining whether a PLR will be read, and better yet acted upon, are 
based on the position your client holds within the organization, and their personal information intake 
profile.   
Add metadata to pdf - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
read pdf metadata java; remove metadata from pdf file
Add metadata to pdf - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
search pdf metadata; delete metadata from pdf
41 
As an example, consider the following advice on presenting to executives within an organization
54
The biggest mistake I see people make is they present to Senior Management the same way they 
would present to their peers or their team.  Remember the higher up a person is in an organization, 
the larger the picture they have of problems and issues.  Think of moving up through the 
ranks of management like a helicopter that climbs higher and higher in the air. On ground level you 
only see things right in front of you, but when you get very high in the air, you can see for miles and 
miles. 
So this means that when you are presenting to upper management you need to THINK about the 
problems and issues from THEIR perspective, not yours.  It is your job to show how what you are 
talking about fits in to the corporate GOALS, VISION & MISSION. 
It is also important to recognize that there is an inverse relationship between the importance of your 
client’s role in an organization, and the amount of time an analyst is likely going to be given to present 
to them. Generally, as discussed in the next section, the most important feature of a PLR should be 
about turning data into intelligence and insight, thus saving your client the time of having to do this 
themselves. In this section a different implication of time, the time available to share the most critical 
aspects of the research, is being discussed. PLRs should include an Executive Summary, and if this 
is the only section the client reads then it needs to deliver the message, or insight the analyst wants to 
portray. Consider generating different versions of the PLR that are appropriate to the different roles 
within an organization that are likely to be interacting with it. 
It is also important to consider the audience for a PLR, and think about the ways in which they 
process and analyze information. On one level people can be consider right-brained or left-brained as 
discussed below
55
According to the theory of left-brain or right-brain dominance, each side of the brain controls different 
types of thinking. Additionally, people are said to prefer one type of thinking over the other. For 
example, a person who is "left-brained" is often said to be more logical, analytical and objective, while 
a person who is "right-brained" is said to be more intuitive, thoughtful and subjective. 
More recent research indicates that this dichotomy is overly simplistic. A more detailed theory 
involving Socionics, provides a more granular approach to methods of learning based on Myers-
Briggs personality types. Additional information on Socionics can be found at the URL provided: 
https://en.wikipedia.org/wiki/Socionics 
When generating a PLR consider whether the primary client is more of an analytical thinker, someone 
who will want to see a logical progression leading to a conclusion, or an intuitive thinker, who is 
leaping ahead to the implications of the research and what impacts they have on their pre-conceived 
notions. Ideally, try to address both types of thinkers but give priority to the personality type of the 
primary client.  
5.2.2 – How does it save the client time? 
The most valuable commodity a PLR can provide a decision-maker is to save them time. PLRs take 
large amounts of raw, unprocessed data and generate insight, and intelligence based on the analysis 
54
http://www.impressionmanagement.com/blog/09-24-2010/presentation-skills-37  
55
http://psychology.about.com/od/cognitivepsychology/a/left-brain-right-brain.htm   
VB.NET PDF insert image library: insert images into PDF in vb.net
VB.NET PDF - Add Image to PDF Page in VB.NET. Guide VB.NET Programmers How to Add Images in PDF Document Using XDoc.PDF SDK for VB.NET.
pdf xmp metadata editor; pdf metadata
C# PDF Password Library: add, remove, edit PDF file password in C#
C# Sample Code: Add Password to PDF with Permission Settings Applied in C#.NET. This example shows how to add PDF file password with access permission setting.
add metadata to pdf programmatically; pdf xmp metadata
42 
conducted and, perhaps more importantly, the interpretation of the results by a skilled analyst. The 
analyst is responsible for applying the intelligence to the specific business context associated with the 
decision being made, and provides recommendations that can be acted upon by the client. Clients are 
looking to analysts to provide an expert opinion, and perspectives based on their knowledge of the 
topic in question, not simply data. 
This can sometimes be a daunting task and many PLRs simply provide summaries of data, without 
taking the extra step of interpreting the results, in view of the objectives that led to the ordering of the 
report in the first place. 
It is also important to recognize that the client does not necessarily understand the nuances of patent 
information, and may likely misinterpret the data if they are not provided with conclusions generated 
from the analyst. Having an analyst expertly interpret this critical data source also saves the decision-
maker from having to develop these skills themselves. 
5.2.3 – How does it add value to the decision making process? 
Many decisions are made without proper intelligence, or analysis, leading to higher risks associated 
with them. Senior-level managers, in particular, tend to rely on a network of familiar advisors, as 
opposed to data driven decision-making, for developing organizational strategy. In technology-driven 
industries, the volume of information available, and the complexity of the issues surrounding the 
decision-making process, is such that relying on personal networks increases the risk that a 
suboptimal result will take place. 
Data analysis allows for all available options to be explored, including allowing for historical 
information that might not otherwise be considered, to approach decision-making in a systematic 
fashion. Since more options, and information, are being considered the risks associated with the 
development of a strategy, or a specific decision, are lowered. Risk cannot be eliminated completely, 
but when all available data is analyzed, using a variety of complementary methods, and procedures, it 
provides confidence that the proposed recommendations will reflect the desired outcome for the 
business. 
From the analyst’s perspective the most valuable results are achieved when a plan for presenting the 
recommendations of the research is developed, and the likely implications, and impacts to the 
organization, are clearly stated. Practically speaking, this requires forming an opinion, supporting it 
through interpretation of data analysis, and providing business perspective for acting on it. 
5.2.4 – How will the user evaluate the effectiveness of the report? 
As stated at the beginning of the chapter, the generation of a PLR is a time intensive and expensive 
endeavor, and it is embarked upon since an organization is preparing to make a significant monetary 
or headcount investment. Understanding how the user will evaluate the PLR is a critical component in 
ensuring that the end product will be satisfactory to them. 
Generally speaking, in regards to PLRs, evaluation looks at whether the right questions were asked 
and whether they were analyzed correctly. It examines the rationale, and the justification of activities, 
in relationship to the decision, associated with the questions. Finally, it eexamines the efficiency of the 
results, or how the time and effort associated with the PLR was converted into results, and provided 
value to the decision-making process. 
C# PDF Sticky Note Library: add, delete, update PDF note in C#.net
C#.NET PDF SDK - Add Sticky Note to PDF Page in C#.NET. Able to add notes to PDF using C# source code in Visual Studio .NET framework.
metadata in pdf documents; edit pdf metadata online
C# PDF Library SDK to view, edit, convert, process PDF file for C#
PDF SDK for .NET allows you to read, add, edit, update, and delete PDF file metadata, like Title, Subject, Author, Creator, Producer, Keywords, etc.
extract pdf metadata; remove pdf metadata online
43 
Understanding these standards leads to the production of high value PLRs that provide excellent 
return on the investment, and lower the risk associated with technological decision-making. Once a 
business leader is introduced to reports of this nature, and discovers how they provide key 
intelligence, they are likely to want to incorporate them frequently into critical objectives, as a matter of 
practice. 
VB.NET PDF Library SDK to view, edit, convert, process PDF file
Various of PDF text and images processing features for VB.NET project. Multiple metadata types of PDF file can be easily added and processed. PDF Metadata Edit.
pdf remove metadata; preview edit pdf metadata
C# PDF insert image Library: insert images into PDF in C#.net, ASP
C#.NET PDF SDK - Add Image to PDF Page in C#.NET. How to Insert & Add Image, Picture or Logo on PDF Page Using C#.NET. Add Image to PDF Page Using C#.NET.
pdf metadata editor; view pdf metadata
44 
Chapter 6: Tasks Associated with Patent Analytics and Landscaping 
When performing data analysis, using patent information, for a Patent Landscape Report (PLR), or for 
most patent analytics projects, there are a finite number of functions or tasks that are available for the 
analyst to consider using. In addition to providing analysis capabilities, some of the tasks are 
associated with preparing data for subsequent analysis, while others provide means for visualizing the 
output from an analysis task. 
This chapter defines and explores the various tasks associated with patent analytics and PLRs, 
provides explanations of why they are used for patent analysis, and suggests a few tools that can be 
used to perform each task. By systematically looking at all of the tasks that are typically associated 
with PLRs an analyst can consider the range of options available to them, and decide which elements 
they will include in their study. 
6.1 – Data Cleanup and Grouping 
Data cleanup and grouping are processes for the manual, or automatic standardization of terms or 
items, within a data field, to correct errors or inconsistencies, or to group synonymous entries. It is 
required by patent analysts in order to produce statistically relevant results. It is necessary since raw 
patent data is notoriously "messy" and requires cleanup or standardization to produce accurate 
results. Misspellings, for instance, are a common occurrence within certain fields, and require 
correction. There are also many terms with the same or similar meanings, within the English 
language, and these should be grouped together when analyzing concepts. 
Using a simple data cleanup example, 3M is listed in most patent assignee fields in a number of 
different ways including: 3M, 3M Inc., 3M Inc, and by its full name, Minnesota Mining and 
Manufacturing. All of these represent the single entity, and have to be grouped together, or 
standardized, in order to perform accurate statistics reflecting the total impact of the organization. 
Grouping these terms together into a single entry is the essence of the data cleanup task. 
Often, it takes more time to prepare patent data for analytics than it does to actually perform the 
analysis. That is certainly true with the data cleanup task, which depending on the method used, can 
take many hours if the user is working with a large data collection. In particular, data cleanup is 
applied to the following fields within patent analytics: 
•  Patent Assignee Cleanup – Perhaps the most often used cleanup task due to misspellings 
and alternative representations of company names. The cleaning of this particular field is 
accomplished by a variety of different methods including bootstrapping, fuzzy logic algorithms, 
and manual methods such as PivotTables. 
•  Inventor Name Cleanup – Misspellings are also common in this field, but just as frequently 
there are issues with whether an individual uses their full first name, their middle name, or 
initial, and in the case of the last name, whether they have changed it due to marriage. Asian 
names, and the order in which they appear also cause problems when cleaning this field. 
Besides cleaning inaccurate data, grouping is also performed in order to aggregate data in various 
patent analysis applications including the following: 
C# TIFF: TIFF Metadata Editor, How to Write & Read TIFF Metadata
You can also update, remove, and add metadata. List<EXIFField> exifMetadata = collection.ExifFields; You can also update, remove, and add metadata.
acrobat pdf additional metadata; batch pdf metadata editor
VB.NET PDF Password Library: add, remove, edit PDF file password
VB: Add Password to PDF with Permission Settings Applied. This VB.NET example shows how to add PDF file password with access permission setting.
edit multiple pdf metadata; pdf metadata reader
45 
•  Technology Categories – synonymous terms from text collections within patent data fields, 
such as the abstract, claims or examples, are grouped together to represent a single concept. 
Cancer, for instance, can be described using additional terms such as neoplasm. Grouping 
terms when creating technology categories are required to ensure that all relevant 
occurrences of a concept are captured during analysis. 
•  Up Posting Classifications – Technical subject matter is often classified by hierarchical lists 
of concepts but analysts may not always want to use them at their most granular, or detailed 
level. When this is the case, more detailed classification can be grouped together, and 
collected as part of a higher-level entry. Using IPC classifications as an example, an analyst 
may group several subgroups together, provide them with a name that represents a 
meaningful concept, and then processes them as a single entity. 
Generally speaking, methods for cleaning up data lists, or grouping concepts, in patents can 
essentially be divided into two categories: manual and automatic. 
Manual Methods 
These methods require the analysts to work with each individual entry in a data field. It requires that 
the analyst knows the relationship between one entry and another, and to be able to decide, if they 
are in fact, the same entry. These methods can be very time consuming, and can be accomplished 
using Pivot Tables or by manipulating lists, one object at a time. 
•  Pivot Tables – Pivot Table functionality allows a user to select one or more rows in a 
spreadsheet and group them together. Once they are grouped the new group can be renamed 
to reflect the desired name for the combined entry. See Figure 1 for an example of using a 
Pivot Table for patent assignee cleanup. 
•  Drag and Drop or Manual Grouping – Some tools provide a list of entries within a field and 
allow the user to either drop one entry on to the top of another to create a grouping, or allow 
multiple entries to be selected, and then grouped by right-clicking or pushing a button. Once 
the entries are grouped the new group can be renamed to reflect the desired content of the 
combined items. 
46 
Figure 1 - Patent Assignee Cleanup Using Pivot Table Function in Microsoft Excel 
Automated Methods 
These methods allow the processing of an entire field of data based on the use of an algorithm, or an 
agreed upon collection of facts. While not as time consuming as manual methods the accuracy of the 
method is only as good as the algorithm used, or the knowledge of the individuals who built the 
collection of facts. Automated methods include the use of Fuzzy Logic, and Bootstrapping. 
•  Fuzzy Logic – An algorithm looks at the string of characters associated with an entry and 
determines the likelihood that two items represent the same entry based on how similar they 
are to one another. There are a variety of different algorithms that take this approach and 
many can be tuned based on the amount of similarity required to form a grouping. 
•  Bootstrapping – This method involves the collection of lists of standardized items that can be 
used to group together entries consistently. The organizations that build databases will often 
use these lists to make certain that they consistently apply the same name to an entry 
regardless of how it may have been used in the source material. Lookup tables can be used to 
transform raw input into standardized entries with large collections. 
The following tools provide for some form of data cleanup or grouping. This is not an exhaustive list 
but provides some suggestions for starting with this task. Contact information for these tools can be 
found in section 9.1 of these guidelines.  
•  STN AnaVist – provides manual grouping which can be saved by user 
•  VantagePoint – allows for the creation of user defined thesaurus and fuzzy logic grouping 
47 
•  Orbit.com – provides manual grouping which can be saved by user, online 
•  Microsoft Excel – includes Pivot Table functionality for manual grouping 
A recent blog post, covering the use of Open Refine to assist with patent assignee cleanup can be 
found at: http://www.patinformatics.com/blog/patent-assignee-cleanup-using-google-refine-open-
refine-text-facets-and-clustering/ 
An additional resource available for grouping assignee names is provided by the Organization for 
Economic Co-operation and Development (OECD), which has developed a collection of cleaned 
patent assignee names that can be used with bootstrapping methods. OECD provides the following 
description of the HAN database
56
The OECD "Harmonized Applicants' Names" database provides a dictionary of applicants’ names 
which have been elaborated with business register data, so that it can easily be matched by all 
users. The data is based on applicants for patents filed to the EPO and through PCT. The dataset is 
complementary to Eurostat's method for harmonizing applicant’s names. 
6.2 – List Generation  
List generation is a statistical method that provides counts of various patent related metrics within 
individual data fields. Identifying the top ten inventors, for instance, is an example of generating a list 
of the most frequently occurring inventors in a patent collection. Figure 2 provides an example of a list 
generated in Microsoft Excel. The preferred method for visualizing a list is by generating a bar chart or 
histogram. This is a two-dimensional analysis with list entries typically displayed along the x-axis and 
the number of occurrences of the entry presented on the y-axis. Lists, and bar charts are used 
frequently in patent analytics, and within PLRs, since they allow for the statistical comparison of two or 
more entities in the same data field. In order to accurately account for the entries in a field, it may 
require standardization, or cleaning, as discussed in section 6.1. 
A great deal of list manipulation is accomplished in a spreadsheet application, like Microsoft Excel, 
where each data field being analyzed is found in a column and the discrete items being analyzed are 
contained in the rows. Columns, or data fields can be sorted in a variety of different ways, but they are 
principally either in descending or ascending order. In a column containing alphabetical data, 
descending order would start with entries containing the letter Z, and would work down the column to 
the letter A. Ascending order would do the opposite, and rows containing the letter A would be at the 
top and would proceed downward towards Z. In a column containing numeric data, descending order 
would begin with the highest number and progress towards the smallest. Ascending order in a 
numeric column would begin with the smallest number and move towards the largest. In some cases, 
the same number may appear in multiple rows, in these circumstances there is normally a secondary 
sort column, which is used to order the entries that share the same value within the primary sort 
column. 
Be careful when working with numerical data columns since sometimes they are entered as 
alphabetic characters as opposed to numbers. When this occurs the sorting will place 11 and 12 next 
to 1 as opposed to 2, as it should be. In most spreadsheet programs it is simple to select a column 
and convert it from alphabetic to numeric entries by changing the format of the entries in the column. 
When sorting within a single column, it is also important to make certain that all of the other columns 
in the data collection get sorted along with the one of interest. Most spreadsheet programs 
56
http://www.oecd.org/sti/inno/oecdpatentdatabases.htm   
48 
automatically ask the user if they want to expand to all columns when sorting, or if they want to sort 
the column individually and leave the other columns as they were. It is almost always the case, when 
generating lists for patent analytics that the user will want to expand the sorting for all of the columns. 
The number of times an entry appears in a list can be generated in a few different ways. A filter can 
be used to remove all of the rows in a spreadsheet except for the ones that contain a specified value. 
After the filtering is complete the analyst can count the number of rows that remain and assign the 
number to that entry in a separate worksheet. This process is repeated for the other unique entries in 
the column, or field. A more efficient way of accomplishing this process is by selecting the rows and 
columns of interest and generating a Pivot Table from them. Once generated, usually in a separate 
worksheet, the application will allow the analysts to decide which data field should represent the rows 
in the table, and which should populate the columns. In a standard list, no additional columns are 
added to the table, and the sum of the field being used for the rows is used in the values portion of the 
table builder. This sequence will be re-visited in section 6.3, but an additional field is added as a 
column for comparing the fields.  
Figure 2 - List of Patent Assignees Using MS Excel 
Once the list is generated, the rows and columns representing the list can be selected, and a bar 
chart can be created by pushing a chart button, or by selecting the appropriate menu item within a 
spreadsheet program. In Microsoft Excel, once a collection of rows and columns is selected, a bar, or 
column chart is created by choosing the option in the Charts portion of the Ribbon or under the Charts 
Menu Bar. At the beginning of this section, a bar chart was described where the field entries were 
listed on the x-axis. In Excel, this sort of horizontal chart is referred to as a column chart. If the field 
entries are listed on the y-axis instead, this is referred to as a vertical chart, and called a bar chart in 
Excel. Figure 3 shows a column chart visualizing the data contained in the list from Figure 2. 
49 
Figure 3 - Column Chart Visualization of Data from Figure 2 
Most of the analytics tools provided in section 9.1 include functionality for generating simple charts of 
most patent information fields associated with the systems. 
6.3 – Co-Occurrence Matrices 
Counting or comparing entries within a single data field is accomplished by generating a list, as 
covered in the previous section. Frequently, an analyst will want to provide additional context to a 
comparison by incorporating an additional variable or field into their analysis. For instance, it is useful 
to understand which organizations have the highest number of patent documents in a technical field, 
but more insight is gained by studying when those organizations filed the patent documents in 
question. It is often the case that two organizations will have a similar total number of documents, but 
one of them will have filed them much earlier than the other. Using a co-occurrence matrix, or table, 
this additional context can be readily represented. 
Co-occurrence matrices are also referred to as tables, and are generated by placing data fields on an 
X and Y-axis, or within a table.  The number of overlapping occurrences of shared X and Y can be 
seen as numbers within the matrix. This representation allows connections to be made between two 
or more fields of information and provides a measure of how strong the connection is. This is 
interpreted by looking at the value provided at the intersection, the higher the value, the stronger the 
correlation between the two elements. 
Most of the analytics tools provided in section 9.1 include functionality for generating co-occurrence 
matrices using patent information fields associated with the systems, but many analysts use Pivot 
Tables in Microsoft Excel to generate them as well. As discussed in section 6.3, the rows and 
columns of interest are selected, and a Pivot Table is generated using them. Once generated, usually 
in a separate worksheet, the application will allow the analysts to decide which data field should 
represent the rows in the table, and which should populate the columns. In a co-occurrence matrix, at 
least one data field is added as column to the table, as well as a field for the rows and the sum of the 
field being used for the rows is used in the Values portion of the table builder. 
Documents you may be interested
Documents you may be interested