Cho hai không gian X và Y, ánh xạ f: X \rightarrow Y thoả mãn hai tính chất:
-
f là song ánh.
- Với mọi x,y \in X, thì f(xy) = f(x)f(y).
Khi đó f được gọi là tự đẳng cấu, và X và Y đẳng cấu với nhau.
Tính chất đẳng cấu giúp bảo toàn toán tử (có thể là cộng, trừ, nhân, chia) từ một không gian này sang không gian khác. Hơn nữa, đẳng cấu f là một quan hệ tương đương, nên nó tạo thành một lớp tương đương C_f, là tập gồm các không gian tự đẳng cấu với nhau. Khi muốn tìm hiểu một phần tử bất kì trong C_f thì chỉ cần chọn ra một không gian để khảo sát, các không gian khác trong C_f cũng có tính chất tương tự.
Quay trở lại vấn đề Feature Normalization. Hàm FeatureNormalize là một tự đẳng cấu chuyển một phần tử trong không gian \mathbb{R}^n thành không gian [-1,1]^n. Vì vậy, tất cả thao tác trên không gian [-1,1]^n đều tương tự như không gian \mathbb{R}^n. Do đó sẽ không có trường hợp nào giải thuật hợp lệ trên [-1,1]^n mà thành giải thuật không hợp lệ trên \mathbb{R}^n.
Lý do thứ hai phải chuyển về không gian chuẩn, vì tuy là hai không gian khác nhau, nhưng sử dụng cùng một hàm metric là Euclidean distance, tổng quát hơn, là cả hai đều có cùng một Euclidean topology. Do đó, độ dài di chuyển trong mỗi bước lặp của giải thuật gần bằng nhau trong [-1,1]^n và \mathbb{R}^n, cụ thể:
d_{[-1,1]^n}(x,y) \approx d_{\mathbb{R}^n}(x,y),
với x,y \in [-1,1]^n \cap \mathbb{R}^n. Từ hai khoảng cách gần bằng nhau dẫn đến số lần lặp giải thuật bé hơn.