how to display pdf file in picturebox in c# : Extract text from pdf with formatting Library application component .net windows wpf mvc Financial%20Modeling%20with%20Excel%20and%20VBA4-part494

© 2011   Ben Van Vliet 
41
O. 
Scaling and Ranking in Practice 
Financial data is often categorized for the purpose of generating factor indicators.  For 
example, valuation factors are often scaled by the industry sector.  Volatility factors are 
sometimes scaled by capitalization group.  For cross-sectional analysis, these groups are 
often defined by fundamental data.  For time-series analysis, these groups may be time 
periods, months, days, or intra-day periods. 
We only scale a given factor by category if we believe the differences between the 
groups are systemic and meaningless.  It also may be the case that the factor is otherwise 
too volatile or unstable to generate meaningful forecasts.  For example, relative value is 
more stable than absolute. 
If the distribution of data in each group, sector, or category is different, then 
scaling by group may not help much, unless you use a ranking method.  Table 4 contains 
some sample data that should illustrate the value of ranking by groups. 
Group 
Raw Data 
22 
25 
26 
28 
30 
35 
36 
39 
Group 
Raw Ranks 
In the first table here, the data for group A clearly indicates a different distribution.  By 
ranking the data by group, we can compare apples to apples from a normalized, z-score 
perspective. 
Some caveats with respect to scaling, ranking and z-scoring should be noted. 
Z-scoring will not prevent most of the bad values from being in group 1.  This 
does not fit most people’s intuitive definition of group neutral.   
Z-scoring a factor by cross-section has the meaning of ranking the particular 
stock’s value on that factor relative to other stocks at that point in time.  This is 
typical for benchmark-aware strategies. 
Z-scoring a factor through time, stock by stock, creates a factor that points to 
unusually high or low values relative to each stocks own history.  This is typical 
for non-portfolio based strategies. 
Extract text from pdf with formatting - extract text content from PDF file in C#.net, ASP.NET, MVC, Ajax, WinForms, WPF
Feel Free to Extract Text from PDF Page, Page Region or the Whole PDF File
get text from pdf c#; copy text from pdf to word with formatting
Extract text from pdf with formatting - VB.NET PDF Text Extract Library: extract text content from PDF file in vb.net, ASP.NET, MVC, Ajax, WinForms, WPF
How to Extract Text from PDF with VB.NET Sample Codes in .NET Application
copy text from pdf without formatting; get text from pdf into excel
© 2011   Ben Van Vliet 
42
P. 
Double Normalizing 
It is also possible to double normalize.  That is, we normalize one way, then the other.  In 
this case the order of normalization—cross-sectional first, or time-series first—is 
important to the final meaning of the factor. 
Example 1 
For example, in the case of performing time-series normalization first, then cross-
sectional normalization, consider the data for IBM: 
IBM 
Month 
Factor Data 
Z-Score 
March 
1.02 
-.23 
April 
2.21 
.96 
May 
1.00 
-.25 
June 
3.52 
2.27 
After the time-series normalization, the factor data and z-score for June clearly appear to 
be unusually high.  However, after a cross-sectional normalization, as can be seen next, 
most other stocks seem to also be high in June. 
Stocks 
Symbol 
June 
Z-Scores 
IBM 
2.27 
LUV 
1.95 
INTC 
2.35 
WMT 
2.02 
So, 2.27 is nothing special in terms of upward movement.   
Example 2 
In the alternative case, where we perform the cross-sectional normalization first, then 
time-series normalization, consider the data:  
Stocks 
Symbol 
June 
Factor Data 
Z-Score 
IBM 
3.52 
1.52 
LUV 
.60 
-.92 
INTC 
2.99 
1.08 
WMT 
1.25 
-.38 
After the cross-sectional normalization, IBM looks particularly good.  After the time-
series normalization, as can be seen in next, IBM’s June Z-Score is high relative to its 
own history in that cross-sectional score. 
C# PDF Convert to Text SDK: Convert PDF to txt files in C#.net
other C# .NET PDF to text conversion controls, RasterEdge C# PDF to text converter control toolkit can convert PDF document to text file with good formatting.
copy text from pdf with formatting; copy text from pdf without formatting
VB.NET Create PDF from PowerPoint Library to convert pptx, ppt to
VB.NET read PDF, VB.NET convert PDF to text, VB.NET extract PDF pages, VB Turn all PowerPoint presentation into high quality PDF without losing formatting.
copy text from protected pdf; copy pdf text with formatting
© 2011   Ben Van Vliet 
43
IBM 
Month 
Factor 
Z-Score 
March 
1.13 
April 
.98 
May 
1.01 
June 
1.52 
Relative to its usual Z-score it looks good, but not quite as good as it looked in after the 
cross-sectional normalization because IBM appears to score consistently high in this 
factor.  
VB.NET Create PDF from Word Library to convert docx, doc to PDF in
VB.NET read PDF, VB.NET convert PDF to text, VB.NET extract PDF pages, VB Export all Word text and image content into high quality PDF without losing
cut and paste pdf text; extract pdf text to excel
VB.NET Image: Robust OCR Recognition SDK for VB.NET, .NET Image
only PDF or Bmp. OCR software retains original layout and formatting of scanned images, fax documents or screen shots. VB.NET Sample Codes to Extract Text from
cut and paste text from pdf document; .net extract text from pdf
© 2011   Ben Van Vliet 
44
Q. 
LAB 5:  Scaling and Ranking
Given the following fundamental data and two stocks: 
ABC 
XYZ 
12.50 
0.12 
9.82 
0.25 
11.77 
0.17 
15.43 
0.05 
19.03 
0.31 
Calculate the Spearman’s rank correlation between the two. 
Given the following data: 
Month 
Stock 
Raw Data 
Jan 
IBM 
2.52 
WMT 
1.19 
MSFT 
.45 
XOM 
5.36 
Feb 
IBM 
2.10 
WMT 
1.11 
MSFT 
.45 
XOM 
5.13 
10 
Mar 
IBM 
2.48 
11 
WMT 
1.36 
12 
MSFT 
.47 
13 
XOM 
4.59 
14 
Apr 
IBM 
2.52 
15 
WMT 
1.43 
16 
MSFT 
.49 
17 
XOM 
4.23 
Performing a double normalization—time-series first, then cross-sectional. 
VB.NET Create PDF from Excel Library to convert xlsx, xls to PDF
& pages edit, C#.NET PDF pages extract, copy, paste C#.NET rotate PDF pages, C#.NET search text in PDF all Excel spreadsheet into high quality PDF without losing
a pdf text extractor; delete text from pdf file
C# PDF Convert to HTML SDK: Convert PDF to html files in C#.net
file. Besides, the converted HTML webpage will have original formatting and interrelation of text and graphical elements of the PDF.
copy text from scanned pdf; copy text from pdf to word
© 2011   Ben Van Vliet 
45
III.  INTRODUCTION TO SIMULATION 
A model is a representation of reality.  Traditionally, models are mathematical equations, 
which are attempts at analytical or closed form, solutions to problems of representation.  
“All models are wrong.  Some models are useful.”  -George Box 
These equations enable estimation or prediction of the future behavior of the system 
from a set of input parameters, or initial conditions.  However, many problems are too 
complex for closed form equations. 
Simulation methods are used when it is unfeasible or impossible to develop a 
closed form model.  Simulation as a field of study is a set of algorithms that depend upon 
the iterative generation of random numbers to build a distribution of probable outcomes.  
Because of their reliance on iteration, sometimes millions of them, simulation is 
accomplished only through the use of computer programs.   
Simulation is especially useful when applied to problems with a large number of 
input distributions, or when considerable uncertainty exists about the value of inputs.  
Simulation is a widely-used method in financial risk analysis, and is especially successful 
when compared with closed-form models which produce single-point estimates or human 
intuition. Where simulation has been applied in finance, it is usually referred to as Monte 
Carlo simulation.   
Monte Carlo methods in finance are often used to calculate the value of 
companies, to evaluate investments in projects, to evaluate financial derivatives, or to 
understand portfolio sensitivities to uncertain, external processes such as market risk, 
interest rate risk, and credit risk.  Monte Carlo methods are used to value and analyze 
complex portfolios by simulating the various sources of market uncertainty that may 
affect the values of instruments in the portfolio.   
Monte Carlo methods used in these cases allow the construction of probabilistic 
models, by enhancing the treatment of risk or uncertainty inherent in the inputs.  When 
various combinations of each uncertain input are chosen, the results are a distribution of 
thousands, maybe millions, of what-if scenarios.  In this way Monte Carlo simulation 
considers random sampling of probability distribution functions as model inputs to 
produce probable outcomes.  
Central to the concept of simulation is the generation of random numbers.  A 
random number generator is a computer algorithm designed to generate a sequence of 
numbers that lack any apparent pattern.  A series of numbers is said to be (sufficiently) 
random if it is statistically indistinguishable from random, even if the series was created 
by a deterministic algorithm, such as a computer program.  The first tests for randomness 
were published by Kendall and Smith in the Journal of the Royal Statistical Society in 
1938.   
These frequency tests are built on the Pearson's chi-squared test, in order to test 
the hypothesis that experimental data corresponded with its theoretical probabilities.  
Kendall and Smith's null hypotheses were that each outcome had an equal probability and 
then from that other patterns in random data would also be likely to occur according to 
derived probabilities.   
VB.NET PDF Convert to Word SDK: Convert PDF to Word library in vb.
application. In addition, texts, pictures and font formatting of source PDF file are accurately retained in converted Word document file.
extract text from pdf to excel; extract text from pdf file
C# Create PDF from Word Library to convert docx, doc to PDF in C#.
A convenient C#.NET control able to turn all Word text and image content into high quality PDF without losing formatting. Convert
export text from pdf to word; export text from pdf
© 2011   Ben Van Vliet 
46
For example, a serial test compares the outcome that one random number is 
followed by another with the hypothetical probabilities which predict independence.   A 
runs test compares how often sequences of numbers occur, say five 1s in a row.  A gap 
test compares the distances between occurrences of an outcome.  If a data sequence is 
able to pass all of these tests, then it is said to be random.  
As generation of random numbers became of more interest, more sophisticated 
tests have been developed.   Some tests plot random numbers on a graph, where hidden 
patterns can be visible.  Some of these new tests are: the monobit test which is a 
frequency test; the Wald–Wolfowitz test; the information entropy test; the autocorrelation 
test; the K-S test; and, Maurer's universal statistical test. 
C# Create PDF from PowerPoint Library to convert pptx, ppt to PDF
Excellent .NET control for turning all PowerPoint presentation into high quality PDF without losing formatting in C#.NET Class. Convert
delete text from pdf preview; copy text from locked pdf
C# Create PDF from Excel Library to convert xlsx, xls to PDF in C#
Turn all Excel spreadsheet into high quality PDF without losing formatting. Evaluation library and components for PDF creation from Excel in C#.NET framework.
extract text from image pdf file; extracting text from pdf
© 2011   Ben Van Vliet 
47
A. 
Uniform Distribution
Parameters a and b, the lower and upper bounds. 
Probability density: 
b a
f x
=
1
( )
Cumulative distribution function F(x): 
b a
x a
F x
( )=
Expected value of x: 
2
( )
a b
E x
+
=
Variance of x: 
12
)
(
( )
2
b a
V x
=
The Linear Congruential Generator (LCG) will generate uniformly distributed integers 
over the interval 0 to m - 1: 
k
d
cu
u
i
i
mod
)
(
1
+
=
The generator is defined by the recurrence relation, where u
i
is the sequence of 
pseudorandom values, and 0 < m, the modulus, 0 < c < k, the multiplier, and 0 < d < m, 
the increment.   u
0
is called the seed value. 
VBA:   
Public Function LCG( c As Double, d As Double, k As Double, _ 
u0 As Double ) As Double 
LCG = (c * u0 + d) Mod k 
End Function 
6578 
=LCG(B1,B2,B3,B4)
=C1/($B$3-1) 
1159  =LCG($B$1,$B$2,$B$3,C1)
=C2/($B$3-1) 
7825 
‘’ 
‘’ 
u0 
5684 
‘’ 
‘’ 
Excel:  
=MOD( c * u0 + d, k ) 
© 2011   Ben Van Vliet 
48
The real problem is to generate uniformly distributed random numbers over the interval 0 
to 1, what we call the standard uniform distribution, where the parameters a = 0 and b = 
1.  A standard uniform random number, u
s
, can be accomplished by dividing the LCG 
random integer by k – 1 as in Table 1.  However, Excel and VBA already have functions 
that return standard uniform random numbers: 
Excel:  
=RAND() 
VBA:   
Public Function UniformRand() As Double 
 UniformRand = Rnd() 
End Function 
Generating Uniformly Distributed Random Numbers: 
VBA:   
Sub Generate() 
Dim i as Integer 
For i = 0 To Range("A1").Value 
Range("A2").Offset(i).Value = Rnd() 
Next i 
End Sub 
In any case, the state of the art in uniform random number generation is the Mersenne 
Twister algorithm.  Most statistical packages, including MatLab, use this algorithm for 
simulation. 
Turning a standard uniform random number, u
s
, into a uniformly distributed random 
number, u, over the interval a to b. 
Excel:  
= a + RAND() * ( b - a ) 
VBA:   
Public Function Uniform( a As Double, b As Double ) As Double 
© 2011   Ben Van Vliet 
49
Uniform = a + Rnd() * ( b – a ) 
End Function 
Generating Uniformly Distributed Random Integers: 
Turning a standard uniform random number, u
s
, into a uniformly distributed random 
integer of the interval a to b: 
Excel:  
= FLOOR( a + RAND() * ( b – a + 1 ), 1 ) 
VBA:   
Public Function Uniform( a As Double, b As Double ) As Double 
Uniform = Int( a + Rnd() * (b - a + 1) ) 
End Function 
© 2011   Ben Van Vliet 
50
III.  CONTINUOUS DISTRIBUTIONS 
A. 
Inverse Transform Method 
The inverse transform method generates random numbers from any probability 
distribution given its cumulative distribution function (cdf).  Assuming the distribution is 
continuous, and that its probability density is actually integratable, the inverse transform 
method is generally computationally efficient.   
The inverse transform methods states that if f(x) is a continuous function with 
cumulative distribution function F(x), then F(x) has a uniform distribution over the 
interval a to b.  The inverse transform is just the inverse of the cdf evaluated at u: 
( )
1
u
x F
=
The inverse transform method works as follows: 
1.
Generate a random number from the standard uniform distribution, u
s
2.
Compute the value x such that F(x) = u.  That is, solve for x so that F
-1
(u) = x. 
3.
x is random number drawn from the distribution f. 
Documents you may be interested
Documents you may be interested