Chapter 3
Visualizing Your Data
Discovering JMP
Comparing Multiple Variables
The additional summary output gives detailed frequencies. This report is discussed in 
“Distributions of Categorical Variables” on page108 in the “Analyzing Your Data” chapter.
Interacting with the Bar Charts
As is the case with histograms, click on individual bars to highlight rows of the data table. If 
more than one graph is created, clicking on a bar in one bar chart highlights the corresponding 
bar or bars in the other bar chart.
For example, suppose that you want to see the distribution of company size for the 
pharmaceutical companies. Click on the Pharmaceutical bar in the Type bar chart, and the 
pharmaceutical companies are highlighted on the Size Co bar chart. Figure 3.7 shows that 
although most companies in this data table are small, most of the pharmaceutical companies 
are medium or big.
Also, the corresponding rows in the data table are selected.
Figure 3.7  Clicking Bars
Comparing Multiple Variables
Use multiple-variable graphs to visualize the relationships and patterns between two or more 
variables. This section covers the following graphs:
Click on this bar to select the corresponding data in the other chart.
Table 3.1  Multiple-Variable Graphs
“Scatterplots” on page72
Use scatterplots to compare two continuous variables.
“Scatterplot Matrix” on 
page 76
Use scatterplot matrices to compare several pairs of 
continuous variables.
Visualizing Your Data
Chapter 3
Comparing Multiple Variables
Discovering JMP
The scatterplot is the simplest of all the multiple-variable graphs. Use scatterplots to 
determine the relationship between two continuous variables and to discover whether two 
continuous variables are correlated. Correlation indicates how closely two variables are related. 
When you have two variables that are highly correlated, one might influence the other. Or, 
both might be influenced by other variables in a similar way.
Figure 3.8  Example of a Scatterplot
“Side-by-Side Box Plots” 
on page 78
Use side-by-side box plots to compare one continuous and 
one categorical variable.
“Overlay Plots” on page81
Use overlay plots to compare one or more variables on the 
Y-axis to another variable on the X-axis. Overlay plots are 
especially useful if the X variable is a time variable, because 
you can compare how two or more variables change across 
“Variability Chart” on 
page 84
Use variability charts to compare one continuous Y variable 
to one or more categorical X variables. Variability charts 
show differences in means and variability across several 
categorical X variables.
“Graph Builder” on 
page 87
Use Graph Builder to create and change graphs interactively.
“Bubble Plots” on page91
Bubble plots are specialized scatterplots that use color and 
bubble sizes to represent up to five variables at once. If one 
of your variables is a time variable, you can animate the plot 
to see your other variables change through time.
Table 3.1  Multiple-Variable Graphs
Chapter 3
Visualizing Your Data
Discovering JMP
Comparing Multiple Variables
This example uses the data table, which contains sales figures and the number 
of employees of a group of companies.
A financial analyst wants to explore the following questions:
• What is the relationship between sales and the number of employees?
• Does the amount of sales increase with the number of employees?
• Can you predict average sales from the number of employees?
To answer these questions, use a scatterplot of Sales ($M) versus # Employ.
Creating the Scatterplot
1. Open the sample data table.
2. Select Analyze > Fit Y by X.
3. Select Sales ($M) and Y, Response.
4. Select # Employ and X, Factor.
Figure 3.9  Fit Y by X Window
5. Click OK.
Visualizing Your Data
Chapter 3
Comparing Multiple Variables
Discovering JMP
Figure 3.10  Scatterplot of Sales ($M) versus # Employ
Interpreting the Scatterplot
One company has a large number of employees and high sales, represented by the single 
point at the top right of the plot. The distance between this data point and all the rest makes it 
difficult to visualize the relationship between the rest of the companies. Remove the point 
from the plot and recreate the plot by following these steps:
1. Click on the point to select it.
2. Select Rows > Hide and Exclude. The data point is hidden and no longer included in 
Note: The difference between hiding and excluding is important. Hiding a point removes it 
from any graphs but statistical calculations continue to use the point. Excluding a point 
removes it from any statistical calculations but does not remove it from graphs. When you 
both hide and exclude a point, you remove it from all calculations and from all graphs.
3. To recreate the plot without the outlier, select Script > Redo Analysis from the red triangle 
menu for Bivariate. You can close the original report window.
Figure 3.11  Scatterplot with the Outlier Removed
Chapter 3
Visualizing Your Data
Discovering JMP
Comparing Multiple Variables
The updated scatterplot provides these answers:
• There is a relationship between the sales and the number of employees.
The data points have a discernible pattern. They are not scattered randomly throughout 
the graph. You could draw a diagonal line that would be near most of the data points.
• Sales do increase with the number of employees, and the relationship is linear.
If you drew that diagonal line, it would slope from bottom left to top right. This slope 
shows that as the number of employees increases (left to right on the bottom axis), sales 
also increases (bottom to top on the left axis). A straight line would be near most of the 
data points, indicating a linear relationship. If you would have to curve your line to be 
near the data points, there would still be a relationship (because of the pattern of the 
points). However, that relationship would not be linear.
• You can predict average sales from the number of employees.
The scatterplot shows that sales generally increase as the number of employees does. You 
could predict the sales for a company if you knew only the number of employees of that 
company. Your prediction would be on that imaginary line. It would not be exact, but it 
would approximate the real sales.
Interacting with the Scatterplot
As with other JMP graphics, the scatterplot is interactive. Hover over the point in the bottom 
right corner with the mouse to reveal the row number (in this example, 28).
Figure 3.12  Hover Over a Point
Click on a point to highlight the corresponding row in the data table. Select multiple points by 
doing one of the following:
• Click and drag with the mouse around the points. This selects points in a rectangular area.
• Select the lasso tool, and then click and drag around multiple points. The lasso tool selects 
an irregularly shaped area.
Visualizing Your Data
Chapter 3
Comparing Multiple Variables
Discovering JMP
Scatterplot Matrix
A scatterplot matrix is a collection of scatterplots organized into a grid (or matrix). Each 
scatterplot shows the relationship between a pair of variables.
Figure 3.13  Example of a Scatterplot Matrix
This example uses the data table, which contains data for solubility 
measurements for 72 different solutes.
A lab technician wants to explore the following questions:
• Is there a relationship between any pair of chemicals? (There are six possible pairs.)
• Which pair has the strongest relationship?
To answer these questions, use a scatterplot matrix of the four solvents.
Creating the Scatterplot Matrix
1. Open the sample data table.
2. Select Graph > Scatterplot Matrix.
3. Select Ether, Chloroform, Benzene, and Hexane, and click Y, Columns.
Chapter 3
Visualizing Your Data
Discovering JMP
Comparing Multiple Variables
Figure 3.14  Scatterplot Matrix Window
4. Click OK.
Figure 3.15  Scatterplot Matrix
Interpreting the Scatterplot Matrix
The scatterplot matrix provides these answers:
• All six pairs of variables are positively correlated.
As one variable increases, the other variable increases too.
• The strongest relationship appears to be between Benzene and Chloroform.
The data points in the scatterplot for Benzene and Chloroform are the most tightly clustered 
along an imaginary line.
Visualizing Your Data
Chapter 3
Comparing Multiple Variables
Discovering JMP
Interacting with the Scatterplot Matrix
If you select a point in one scatterplot, it is selected in all the other scatterplots.
For example, if you select a point in the Benzene versus Chloroform scatterplot, the same point 
is selected in the other five plots.
Figure 3.16  Selected Points
Side-by-Side Box Plots
Side-by-side box plots show the following:
• the relationship between one continuous variable and one categorical variable
• differences in the continuous variable across levels of the categorical variable
Select this point.
The same point is 
selected in the other 
Chapter 3
Visualizing Your Data
Discovering JMP
Comparing Multiple Variables
Figure 3.17  Example of Side-by-Side Box Plots
This example uses the data table, which contains data on pain measurements 
taken on patients using three different drugs.
A researcher wants to explore the following questions:
• Are there differences in the average amount of pain control among the drugs?
• Does the variability in the pain control given by each drug differ? A drug with high 
variability would not be as reliable as a drug with low variability.
To answer these questions, use a side-by-side box plot for the pain levels and the drug 
Creating the Side-by-Side Box Plots
1. Open the data table.
2. Select Analyze > Fit Y by X.
3. Select pain and click Y, Response.
4. Select drug and click X, Factor.
Visualizing Your Data
Chapter 3
Comparing Multiple Variables
Discovering JMP
Figure 3.18  Fit Y by X Window
5. Click OK.
6. From the red triangle menu, select Display Options > Box Plots.
Figure 3.19  Side-by-Side Box Plots
Interpreting the Side-by-Side Box Plots
Box plots are designed according to the following principles:
• The line through the box represents the median.
• The middle half of the data is within the box.
• The majority of the data falls between the ends of the whiskers.
• A data point outside the whiskers might be an outlier.
The box plots in Figure 3.19 show these answers:
• There is evidence to believe that patients on drug A feel less pain, since the box plot for 
drug A is lower on the pain scale than the others.
• Drug B appears to have higher variability than Drugs A and C, since the box plot is taller.
