c# parse pdf data : Adding metadata to pdf files application software tool html windows winforms online xnumbers-tutorial15-part885

Xnumbers Tutorial 
50 
Linear Regression Formulas 
Generally, the multivariate linear regression function is: 
m m
a x
ax ax
y a
...
2 2
1 1
0
+
+
+
=
where:     
[
]
m
a
a a a
, , ...
2
1
0
The coefficients of regression can be found by the following algorithm 
Make the following variables substitution: 
1..m
for i
=
=
x x
X
i
i
y y
Y
= −
=
where the right values are the averages of samples 
y
and 
x
respectively: 
=
k
k
y
n
y
1
=
k
ik
i
x
n
x
,
1
After that, the coefficients a= [a
1
, a
2
, ....a
n
] are the solution of the following linear system  
C a a b
[ ]⋅ ⋅ =
[ ]
where [C] is the cross-covariance matrix, and b is the XY covariance 
=
=
=
=
=
=
=
j
m j
j
m j
j
j
j
j
m j
j
j
j
j
j
j
j
j m m j
j
j
j
j
j
j
j
j
X
X X
X
X
X
X
X
X
X X
X X
X X
X
2
,
,
3,
2
3,
,
2,
3,
2,
2
2,
,
1,
3,
1,
2,
1,
2
1,
..
..
..
C
=
j
j m m j
j
j
j
j
j
j
j
j
j
YX
YX
YX
YX
,
3,
2,
1,
....
b
and the constant coefficient is given by: 
=
= −
m
i
i i
aX
Y
a
1
0
For m=1 we obtain the popular formulas of the monovariate linear regression 
=
j
j
j
j
j
X
YX
a
2
1
Y aX
a
1
0
= −
=
This is the linear solution known as the Ordinary Least Squares (OLS). The analysis of this kind 
of approach shows that, for large dimensions of n (many measurement values) the matrix C 
becomes nearly singular 
Adding metadata to pdf files - add, remove, update PDF metadata in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Allow C# Developers to Read, Add, Edit, Update and Delete PDF Metadata
change pdf metadata creation date; delete metadata from pdf
Adding metadata to pdf files - VB.NET PDF metadata library: add, remove, update PDF metadata in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
Enable VB.NET Users to Read, Write, Edit, Delete and Update PDF Document Metadata
remove metadata from pdf; pdf metadata viewer
Xnumbers Tutorial 
51 
Linear Regression Covariance Matrix 
xRegLinCov ( Y, X, Coeff, [DgtMax], [Intcpt] ) 
Returns the (m+1 x m+1) covariance matrix of a linear regression of m independent variables 
m
m
a x
a x
ax
y a
+
+
+
=
...
ˆ
2 2
1 1
0
For a given set of n points 
, )
(
2
1
i
mi
i
i
i
x y
x x
P=
Parameter Y is an (n x 1)  vector of dependent variable. Parameter X is a matrix of independent 
variables. It may be an (n x 1) vector for monovariable regression or an (n x m) matrix for 
multivariate regression. 
Parameter Coeff is the (m+1) vector of the linear regression coefficents 
Cross Covariance Matrix  
Given the matrix X of the independent variables points 
Intercept calculated 
Intercept = 0 
=
mn
n
m
m
x
x
x
x
x
x
X
...
1
...
...
...
...
...
1
...
1
1
2
12
1
11
=
mn
n
m
m
x
x
x
x
x
x
X
...
...
...
...
...
...
2
2
12
1
11
The covariance matrix C is 
(
)
1
2
⋅ ⋅
=
T
C s s X X X
Where: 
(
)
1
ˆ
2
2
− −
=
n m
y y
s
i
i
i
The covariance matrix C is 
(
)
1
2
⋅ ⋅
=
T
C s s X X X
Where: 
n m
y y
s
i
i
=
2
2
)
ˆ
(
Note that the square roots of the diagonal elements of the covariance matrix 
ii
i
c
s =
are the standard deviations of the linear regression coefficients  
VB.NET PDF Library SDK to view, edit, convert, process PDF file
Multiple metadata types of PDF file can be Capable of adding PDF file navigation features to your VB formats; merge, append, and split PDF files; insert, delete
batch update pdf metadata; remove metadata from pdf acrobat
C# PDF Library SDK to view, edit, convert, process PDF file for C#
Multiple metadata types of PDF file can be Capable of adding PDF file navigation features to your C# formats; merge, append, and split PDF files; insert, delete
remove pdf metadata online; c# read pdf metadata
Xnumbers Tutorial 
52 
Linear Regression Statistics 
xRegLinStat( Y, X, Coeff, [DgtMax], [Intcpt])  
Returns some statistics about the linear regression  
R
2
Square of the linear correlation factor 
S
y,x
Standard deviation of the linear regression 
Parameter Y is a vector (n x 1) of dependent variable.  
Parameter X is a list of independent variable. It may be an (n x 1)  vector for monovariable 
regression or a (n x m) matrix for multivariate regression. 
Coeff is the coefficients vector of the linear regression function [a
0
, a
1
, a
2
...a
m
].  
Formulas
The regression factor (better: the square of regression factor) R
2
lie between 0 and 1 and 
roughly indicates how closely the regression function fits the given values Y. 
Generally, it can be computed by the following formula: 
2
2
*
2
* 2
2
1
)
(
)
(
1
y
y y
i
i
i
i
i
y
y
y
y
R
σ
σ
= −
= −
Where 
*
y
is the value estimated by the regression function and 
y
is the mean of y values. 
m m
a x
ax ax
a
y
...
*
2 2
1 1
0
+
+
+
=
=
k
k
y
n
y
1
For monovariate regression (m=1), the above formula returns the popular formula: 
(
)
(
)
=
n
y
y
n
x
x
R
2
2
2
2
2
Standard error of the linear regression is: 
Intercept calculated 
Intercept constrained to 0 
(
)
1
2
*
,
− −
=
gl
n
y y
s
i
i
i
y x
(
)
gl
n
y y
s
i
i
i
yx
=
2
*
,
Where gl = number of independent variables 
C# PDF Page Insert Library: insert pages into PDF file in C#.net
such as how to merge PDF document files by C# code PDF document pages and how to split PDF document in APIs, C# programmers are capable of adding and inserting
pdf keywords metadata; edit pdf metadata online
VB.NET PDF File & Page Process Library SDK for vb.net, ASP.NET
On this VB.NET PDF document page modifying page, you will find detailed guidance on creating, loading, merge and splitting PDF pages and Files, adding a page
embed metadata in pdf; pdf metadata viewer online
Xnumbers Tutorial 
53 
Linear Regression Evaluation  
= xRegLinEval(Coeff, X)   
Evaluates the multivariate linear regression in multi precision arithmetic. 
Parameter Coeff is the coefficients vector [a
0
. a
1
, a
2
, ....] of the linear regression 
Parameter X is the vector of independent variables. It is one value for a simple regression 
The functions return the linear combination. 
n n
a x
ax a a x
y a
...
2 2
1 1
0
+
+
+
=
Example: Plot the linear regression for the following data set 
-1 
0.58 
-0.8 
0.65 
-0.6 
0.88 
-0.4 
1.25 
-0.2 
1.32 
1.14 
0.2 
1.31 
0.4 
1.51 
0.6 
1.54 
0.8 
1.48 
1.98 
In this worksheet, each value of linear regression 
*
y
is computed by the function xRegLinEval. 
The regression coefficients are computed by xRegLinCoef. The results are converted in double 
by the function xcdbl. 
Selecting the range A1:C12 and plotting the data we get the following regression graphs 
0
0.4
0.8
1.2
1.6
2
2.4
-1
-0.75
-0.5
-0.25
0
0.25
0.5
0.75
1
y
y*
C# Create PDF Library SDK to convert PDF from other file formats
Besides, using this PDF document metadata adding control, you can created PDF file by adding digital signature Create PDF Document from Existing Files Using C#.
read pdf metadata online; pdf xmp metadata viewer
C# TIFF: TIFF Editor SDK to Read & Manipulate TIFF File Using C#.
1. Support embedding, removing, adding and updating ICCProfile. 2. Render text to text, PDF, or Word file. Tiff Metadata Editing in C#.
google search pdf metadata; bulk edit pdf metadata
Xnumbers Tutorial 
54 
Polynomial Regression - Coefficient 
xRegPolyCoef( Y, X, Coeff, [Degree], [DgtMax], [Intcpt])  
Computes the polynomial regression with the least squares method in multi precision 
arithmetic. 
m
m
a x
ax ax
y a
+
+
+
=
...
2
2
1
0
with m > 1 
Y is a vector (n x 1) of the dependent variable.  
X is a vector (n x 1) of the independent variable 
Degree  is the degree m >1 of the polynomial 
DgtMax sets the precision (default 30). 
Intcpt = true/false. If true (default) the algorithm calculates the intercept; otherwise the intercept 
is set to 0 
The function returns the coefficient vector [a
0
, a
1
, a
2
...a
m
Example. Find the 3rd degree polinomial fitting the given data set (xi, yi) 
Polynomial Regression - Standard Deviation of Estimates  
xRegPolyErr ( Y, X, Coeff, [Degree], [DgtMax], [Intcpt])   
Returns the standard deviation of the polynomial regression estimate  
Y is a vector (n x 1) of dependent variable values.  
X is a vector (n x 1) of the independent variable 
Coeff is the coefficients vector [a
0
, a
1
, a
2
...a
m
]. of the polynomial regression 
DgtMax sets the precision (default 30).. 
Intcpt = true/false. If true (default) the algorithm calculates the intercept; otherwise the intercept 
is set to 0 
see above example 
Polynomial Regression Statistics  
xRegPolyStat ( Y, X, Coeff, [Degree], [DgtMax], [Intcpt])   
Computes the R-squared factor of the polynomial regression and the standard deviation of the 
regression. 
C# PDF insert image Library: insert images into PDF in C#.net, ASP
application? To help you solve this technical problem, we provide this C#.NET PDF image adding control, XDoc.PDF for .NET. Similar
modify pdf metadata; view pdf metadata
C# PDF insert text Library: insert text into PDF content in C#.net
text character and text string to PDF files using online text to PDF page using .NET XDoc.PDF component in Supports adding text to PDF in preview without adobe
add metadata to pdf; pdf metadata extract
Xnumbers Tutorial 
55 
2
R
R-Squared coefficient of the polynomial regression 
yx
S
,
Standard Deviation of the polynomial regression 
Y is a vector (n x 1) of dependent variable values.  
X is a vector (n x 1) of the independent variable 
Coeff is the coefficients vector [a
0
, a
1
, a
2
...a
m
]. of the polynomial regression 
DgtMax sets the precision (default 30). 
Intcpt = true/false. If true (default ) the algorithm calculates the intercept deviation; otherwise 
this is set to 0 
If you wanto to see the standard deviation select two cells and give the CTRL+SHIFT+ENTER 
sequence.  
Macro - Regression  
Xnumbers contains two macros performing the linear and polynomial regression in 
multiprecision arithmetic. From the Xnumbers menu, select  
•  Macro \ Regression \ Linear    
•  Macro \ Regression \ Polynomial   
Data XY is an array containing the column of the variable X at the left with the adjacent column 
of Y at the right. For a m-multivariate regression also the columns of X must be exactly m. 
Select this range before starting the macro. In this case the input box will be automatically filled 
Data XY for univariate and  
polynomial regression 
Data XY for  
multivariate regression 
Output cell indicates the starting upper left cell of the output area. 
Intercept. If checked the macro calculates the intercept otherwise it is set to 0 
Convert to double. Converts the multiprecision in double before the output 
VB.NET PDF insert text library: insert text into PDF content in vb
Multifunctional Visual Studio .NET PDF SDK library supports adding text content to adobe PDF to add a single text character and text string to PDF files in VB
batch pdf metadata editor; pdf remove metadata
C# PDF File & Page Process Library SDK for C#.net, ASP.NET, MVC
Edit URL. Bookmark: Edit Bookmark. Metadata: Edit, Delete Metadata. a PDF to two and four new PDF files are offered Provides you with examples for adding an (empty
preview edit pdf metadata; read pdf metadata java
Xnumbers Tutorial 
56 
R-squared + residual std. dev. Calculate the correspondent statistics 
Estimate std. dev. Calculate the standard deviation of estimate 
Digits Max. from 1 to 200, sets the precision (default 30) 
Degree. The panel of the Polynomial Regression macro is similar to the Linear except for the 
input degree box that allows to chose the polynomial degree. 
An example of the regression output is. 
To obtain this  result follow this steps:. 
•  Select the range A2:C7 and start the macro.  
•  Select all the option boxes and deselect the "double conversion" in 
order to see all the 30 digits.  
Note. The text has been added by hand only for clarity. The macro do not write them. We do it. 
The coefficient a
0
(intercept) will be always output. If the intercept is switched off, the result in 
the cell F2 will be 0  
Xnumbers Tutorial 
57 
Sub-Tabulation 
One important application of linear regression is the sub-tabulation, which is the method to 
extract a table of values with smaller step from an original table with bigger steps. In other 
words, we can obtain a fine tabulation from a table with a few values of a function. Let’s see 
this example. 
Example: Extract from the following dataset, a table having 11 values with step 0.1, from 0 to 1 
5.1 
0.2 
4.7 
0.5 
4.5 
0.6 
4.3 
0.7 
4.2 
3.6 
3.00
3.50
4.00
4.50
5.00
5.50
0
0.2
0.4
0.6
0.8
1
The graph shows the extra points added by the sub tabulation. Note that this method is 
different from the interpolation because the regression line does not pass through any of the 
original points. The new values of the table B are different from the ones table A even in the 
same x-values. 
This feature came in handy when we want to regularize the row data. 
Data Conditioning 
The conditioning of the data consists of subtracting the mean from the values of the sample. It 
can improve the accuracy of the linear regression, but the regression coefficients obtained - 
conditioned coefficients - are different from the regression coefficients of the row data. They 
can be back-transformed by the following method: 
Given X and Y two data vectors, the linear regression polynomial of n degree well be: 
First of all, we find the linear regression coefficients 
[ a
0
, a
1
Than we re-calculate the values 
i
= a
0
+ a
1
  ,   i = 
1…10,  h = 0.1
Xnumbers Tutorial 
58 
=
=
n
i
i
i
a x
p x
p
0
( )
We made the data conditioning, making the average of X and Y 
1
1
=
=
i
i
y
n
y
x
n
x
Substituting the old variables with the new variable u and v 
y
y
v
x
x
u
i
i
i
i
=
=
Than, the new linear regression polynomial well be: 
=
=
n
i
i
i
b u
pu
0
( )
The original a
i
coefficients can be obtained from the new b
i
coefficients by the following 
formulas. 
i
i
n
i
i
b x
y
a
⋅ ⋅
= +
=0
0
( 1)
i k
i
n
i k
i k
k
b x
k
i
a
=
+
⋅ ⋅
=
( 1)
This method is often useful for increasing the gloabal accuracy of the linear regression 
Xnumbers Tutorial 
59 
Linear Regression with Robust Method 
RegLinRM(x, y, [Method]) 
This function
1
performs the linear regression with three different robust methods:  
- SM: simple median 
- RM: repeated median 
- LMS: least median squared 
Robust methods are suitable for data containing wrong points. When data samples have noise 
(experimental data), the basic problem is that classic LMS (least minimum squared) is highly 
affected by noisy points. The main goal of robust methods is to minimize as much as possible 
the influence of the wrong points when fitting the function 
The parameter x and y are two vectors of the points to fit.  
The optional parameter "Method" sets the method you want to use (default = SM) 
The functions returns an array of two coefficients [a1, a0]  where  
0
1
y a a x x a
≅ ⋅ ⋅ +
Use CTRL+SHIFT+ENTER to paste it. 
Example: Suppose you have sampled 5 experimental values (xi, yi), with a (suspected) large 
error in the last value 6.5.  
1.1 
3.1 
3.8 
6.5 
In the graph are shown the 
regression lines obtained with 
all robust methods in 
comparison with the standard 
OLS regression. 
As we can see all the lines SM, RM, LMS (Robust Methods) minimize the influence of the value 
(5, 6.5) 
1
The routines for robust linear regression were developed by Alfredo Álvarez Valdivia. They appear in this collection 
thanks to its courtesy 
Linear Regression
0
1
2
3
4
5
6
7
0
1
2
3
4
5
6
Ordenadas
SM
RM
LMS
MM.CC.
Standard
Documents you may be interested
Documents you may be interested