Solve this for the quiz
sepalWidth | petalWidth | sampleNum | irisSpecies | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3
Don't use plagiarized sources. Get Your Custom Essay on
Rapid Miner
Just from $13/Page
| .5 | .2 | id_1 | Iris-setosa | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.0 | id_2 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3 | .6 | id_5 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.9 | .4 | id_6 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.4 | .3 | id_7 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3 | .1 | id_10 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_12 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_14 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4.0 | id_15 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4.4 | id_16 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_17 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.5 | id_18 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.8 | id_19 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_20 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.7 | id_22 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_23 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_25 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_26 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_27 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_29 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.2 | id_3 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.1 | id_31 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4.1 | id_33 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
4.2 | id_34 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_36 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_37 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_38 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_39 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_4 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.3 | id_42 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_43 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_44 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_47 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_49 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
3.3 | id_50 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.4 | id_51 | Iris-versicolor | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.5 | id_52 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_53 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.8 | id_55 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.3 | id_56 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.4 | 1.0 | id_58 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.0 | id_61 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_62 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.2 | id_63 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.9 | id_64 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_66 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_67 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.7 | id_68 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.5 | 1.1 | id_70 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.8 | id_71 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_73 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.2 | id_74 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_76 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_77 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.7 | id_78 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_8 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_82 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_83 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1.6 | id_84 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_85 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_87 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_89 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_9 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
2.6 | id_91 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_93 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_94 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_96 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_97 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_98 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_99 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_11 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_13 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_21 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_24 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_28 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_32 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_35 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_41 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_45 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_46 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_48 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_54 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_57 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_59 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_60 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_65 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_69 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_72 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_75 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_79 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_80 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_86 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_88 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_92 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_95 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
id_100 |
1
Data Mining
3
Classify Data Using Logistic Regression
In DM3, we are going to build and evaluate a logistic regression model. Out final process will look like
the image below:
Task 1: Prepare Dataset for Analysis
1. Add Data.
a) Click the Add Data button in the Repository panel.
b) Click My Computer in the ‘Import Data – Where is your data?’ pop up
c) Navigate to your Week 5 content folder and download the file named ‘DM3.iris.xlsx.’ Click Next.
d) Import all cells (click Next) and do not change any settings in ‘Format Your Column’ (click Next).
On the ‘Where to store data’ screen, ensure the ‘data’ folder is highlights. Click the Finish button
at the bottom of the screen.
e) In the Repository panel, go to the Local Repository, open the data folder, and drag the ‘DM3.iris’
data set into the Process panel.
2. Set Role.
a) Drag the Set Role operator into the Process window. Connect it with the Retrieve operator.
b) Use the Set Role operator to set the irisSpecies attribute to ‘label’ and the sampleNum attribute to
‘id.’(You can refer back to HW2 for more detailed directions on how to do this)
You should be familiar with these first two sub tasks from DM1. Now we will do some additional
preparation before building a model using logistic regression.
3. Split Data.
Up to this point, we have used a distinct training set and testing set. We first built the model using the
training set. We then simulated collecting new data with the training set and we classified this new data
using the model. However, in real life, we will often want to build and test a model using already collected
data. We can easily split data into multiple sets using RapidMiner’s
Split Data operator.
a) In the Operators panel, search for the Split Data operator.
b) Drag the Split Data operator into the Process. Connect the “exa” output port from the Set Role
operator to the “exa” input port of the Split Data operator.
c) Select the Split Data operator.
d) In the Parameters pane for the Split Data operator, click the Edit Enumeration button
e) In the Edit Parameter Lists popup, click the Add Entry button.
f) Set the text box under ratio to 0.7.
DM3_iris
2
g) Click Add Entry again.
h) This time, set the ratio text box to 0.3
i) Click OK.
The Split Data operator splits the data into subsets based on the values in the ratio operator. We just split
the data into two subsets. The first subset contains 70% (or 0.7) of the data and the second subset contains
30 (or 0.3) of the data. The sets are non-overlapping.
Task 2: Build a Logistic Regression Model
1. Build a Logistic Regression Model.
a) Search the Operators panel for the Logistic Regression operator.
b) Drag the Logistic Regression operator into the Process panel.
c) Connect the first partition “par” output port of the Split Data operator to the Logistic Regression
training “tra” input port of the Logistic Regression operator.
d) Connect the model “mod” output port of the Logistic Regression operator to the results “res” port
e) Run the process
Congratulations! You have just created a logistic regression model. In the results window, select the
Logistic Regression tab. Here, you can see the coefficients for the model. If we were to write these out as
an equation, we would have the following:
?(?) = −8.1 + 41.9 ∗ ????? ????ℎ − 7.9 ∗ ????? ????ℎ
3
• The decision boundary is the line that is created when f(x) = __________________?
• Which species does the model predict when f(x) > 0? ______________? (Hint: plug in values for
one of the plants into the logistic regression equation)
• Which species does the model predict given the following attributes? _____________
sepal width = 2.3, petal width = 1
In addition to the coefficients, the logistic regression model returns coefficients resulting from
standardizing the data (i.e., the Std. Coefficients column). Standardizing data is useful to help interpret the
coefficients. The magnitude of standardized coefficients provides a more easily interpreted assessment of
the relative importance of each attribute.
• Which attribute is the most important for classifying iris species? _________________
• How much more important is it than the next most important factor? ______________
Finally, you will see the z-Value and p-Value for each attribute. You may remember using these values in
your statistics class. However, understanding and interpreting these values is beyond the scope of this
course.
Task 3: Evaluate the Model
1. Apply Model.
Now that we’ve built the model, let’s apply it to the 30% testing subset we previously created using the
Split Data operator.
a) Search for the operator Apply Model and drag it into the process.
b) Connect the model (“mod”) output port of Logistic Regression to the model (“mod”) input port of
the Apply Model operator.
c) Connect the 2nd partition (“par”) output port from the Split Data model to the unlabeled data
(“unl”) input port of the Apply Model operator.
d) Connect the labeled data (“lab”) output port to the results (“res”)
e) Run the process
Since the original data was labeled (using the Set Role operator), the 30% testing subset is also labeled.
So, we can now compare the model’s prediction with the actual labels. A quick scan of the results
indicates the model correctly labeled all the test examples!
4
4. Evaluate Model Performance.
Manually scanning results is tedious. Imagine if we actually had thousands or even millions of examples!
Fortunately, there is better way.
a) Search for the Performance operator and drag it into the process. (Make sure you grab the
Performance operator and not any of the derivatives (e.g., Performance (Classification),
Performance (Binomial Classification), etc. You may need to scroll down the operator pane to
find it.)
b) Connect the labeled data (“lab”) output port from the Apply Model operator to the labeled data
(“lab”) input port on the Performance operator.
c) Connect the performance (“per”) output port of the Performance operator to the results (“res”) port
d) Run the process
In the results window, you will find the below matrix:
Notice that accuracy is 100%. As you might expect, accuracy is the number of correct classifications
divided by the number of examples. In this case, the model labeled 30/30 correctly for an accuracy of
100%. Our model is seemingly perfect. However, accuracy alone is rarely used to evaluate a model.
5
The performance matrix shows some of the other measures used to evaluate a model such as precision
and recall. We will discuss more on model evaluation in future lessons.
4. Save your process.
a) Click the Save icon (alternatively, you can press Ctrl-S).
b) Name the process ‘Iris_LogRegres’ and make sure it is being saved in the processes folder of the
Repository. Click OK to Save.
Congratulations! You have added logistic regression to your growing repertoire of data mining
techniques. You are on your way to becoming a data scientist!
To summarize:
• Linear classification uses a line to partition data
• Logistic regression is one way to create the line by maximizing the likelihood that each point is
correctly classified
• Accuracy is one of several ways to evaluate a model
DELIVERABLE:
• Submit answers via iLEARN.
• Export your process as ‘[lastName]. Iris_LogRegres.rmp’ to your iLearn Data Mining 3 quiz
We provide professional writing services to help you score straight A’s by submitting custom written assignments that mirror your guidelines.
Get result-oriented writing and never worry about grades anymore. We follow the highest quality standards to make sure that you get perfect assignments.
Our writers have experience in dealing with papers of every educational level. You can surely rely on the expertise of our qualified professionals.
Your deadline is our threshold for success and we take it very seriously. We make sure you receive your papers before your predefined time.
Someone from our customer support team is always here to respond to your questions. So, hit us up if you have got any ambiguity or concern.
Sit back and relax while we help you out with writing your papers. We have an ultimate policy for keeping your personal and order-related details a secret.
We assure you that your document will be thoroughly checked for plagiarism and grammatical errors as we use highly authentic and licit sources.
Still reluctant about placing an order? Our 100% Moneyback Guarantee backs you up on rare occasions where you aren’t satisfied with the writing.
You don’t have to wait for an update for hours; you can track the progress of your order any time you want. We share the status after each step.
Although you can leverage our expertise for any writing task, we have a knack for creating flawless papers for the following document types.
Although you can leverage our expertise for any writing task, we have a knack for creating flawless papers for the following document types.
From brainstorming your paper's outline to perfecting its grammar, we perform every step carefully to make your paper worthy of A grade.
Hire your preferred writer anytime. Simply specify if you want your preferred expert to write your paper and we’ll make that happen.
Get an elaborate and authentic grammar check report with your work to have the grammar goodness sealed in your document.
You can purchase this feature if you want our writers to sum up your paper in the form of a concise and well-articulated summary.
You don’t have to worry about plagiarism anymore. Get a plagiarism report to certify the uniqueness of your work.
Join us for the best experience while seeking writing assistance in your college life. A good grade is all you need to boost up your academic excellence and we are all about it.
We create perfect papers according to the guidelines.
We seamlessly edit out errors from your papers.
We thoroughly read your final draft to identify errors.
Work with ultimate peace of mind because we ensure that your academic work is our responsibility and your grades are a top concern for us!
Dedication. Quality. Commitment. Punctuality
Here is what we have achieved so far. These numbers are evidence that we go the extra mile to make your college journey successful.
We have the most intuitive and minimalistic process so that you can easily place an order. Just follow a few steps to unlock success.
We understand your guidelines first before delivering any writing service. You can discuss your writing needs and we will have them evaluated by our dedicated team.
We write your papers in a standardized way. We complete your work in such a way that it turns out to be a perfect description of your guidelines.
We promise you excellent grades and academic excellence that you always longed for. Our writers stay in touch with you via email.