Công cụ phân tích trong JMP Pro dùng để tạo mô hình phân loại (classification) — và cũng có thể dùng cho hồi quy — bằng thuật toán Support Vector Machines.
Support Vector Machines Platform trong JMP là một nền tảng phân loại mạnh mẽ trong JMP Pro, dùng SVM – thuật toán học có giám sát để tạo ra mô hình phân loại chính xác (và cả hồi quy nếu cần), tích hợp các chỉ báo đánh giá chất lượng mô hình, trực quan hóa kết quả, và cho phép xử lý dữ liệu phức tạp, phi tuyến.
📌 1. SVM là gì?
SVM (Support Vector Machine) là một thuật toán học có giám sát trong machine learning được dùng để phân loại dữ liệu bằng cách tìm một đường (hoặc mặt phẳng) tối ưu phân tách các nhóm dữ liệu khác nhau. Ý tưởng là tìm hyperplane (siêu phẳng) mà tối đa hóa khoảng cách (margin) giữa các lớp dữ liệu để mô hình dự đoán chính xác hơn.
📊 2. SVM trong JMP: mục đích & lợi ích
Mục đích chính
👉 Xây dựng mô hình dự đoán hoặc phân loại các quan sát mới dựa trên dữ liệu đã biết (training data). Khi biến Y là danh mục (categorical), SVM dùng để phân loại các đối tượng vào lớp phù hợp.
Điểm nổi bật của SVM trong JMP:
-
Có thể xử lý phân loại nhị phân hoặc nhiều lớp.
-
Có thêm kernel (hàm hạt nhân) như radial basis function, giúp xử lý dữ liệu không thể phân tách tuyến tính bằng cách map sang không gian cao chiều hơn.
-
Cung cấp ma trận nhầm lẫn (confusion matrix), ROC curve, misclassification rate giúp đánh giá chất lượng mô hình.
-
Có thể dùng cho hồi quy (SVR) khi biến đáp ứng là liên tục.
👉 Tóm lại: SVM trong JMP là nơi bạn xây dựng mô hình phân loại/dự đoán thông minh dựa trên nguyên lý tối ưu biên phân tách dữ liệu.
🧠 3. Khi nào nên dùng SVM trong JMP
| Trường hợp | Có nên dùng SVM không |
|---|---|
| Phân loại nhị phân (2 lớp) | ⭐⭐⭐⭐⭐ |
| Phân loại nhiều lớp | ⭐⭐⭐⭐ |
| Dữ liệu tuyến tính dễ tách | ⭐⭐⭐ |
| Dữ liệu phi tuyến | ⭐⭐⭐⭐⭐ bằng kernel |
| Muốn kết quả trực quan, dự báo chính xác | ⭐⭐⭐⭐ |
👉 SVM cực kỳ mạnh khi dữ liệu không phân cách tuyến tính rõ ràng, hoặc bạn muốn mô hình có biên phân tách lớn nhất để tăng khả năng tổng quát hóa.
⚙️ 4. Cách sử dụng trong JMP (tóm tắt)
-
Vào Analyze > Predictive Modeling > Support Vector Machines.
-
Chọn:
-
Biến đáp ứng (Y) là biến phân loại.
-
Các biến dự đoán (X).
-
-
Chọn phương pháp validation (ví dụ phân chia dữ liệu) nếu cần.
-
Chọn kernel (linear hoặc RBF) để phù hợp với dữ liệu.
-
Chạy để tạo mô hình và xem kết quả như Response Profile Plot, Confusion Matrix, ROC Curve…
📉 5. Output chính khi phân loại
Sau khi chạy, JMP sẽ hiện:
✅ Response Profile Plot – trực quan phân vùng phân loại.
✅ Confusion Matrix – đánh giá đúng/sai của mô hình.
✅ ROC Curve – đo khả năng phân loại tổng thể.

COMMENTS