Ông Nguyễn Lê Thanh, Giám đốc Công nghệ kỹ sư phần mềm của Hệ sinh thái (Hiệp hội BĐS Việt Nam) chia sẻ với phóng viên về vấn đề này.
Bộ từ điển về nhà ở là thuật ngữ mới, lần đầu tiên có tại Việt Nam. Ông có thể chia sẻ rõ hơn bộ từ điển có những nội dung gì và tại sao Hệ sinh thái đầu tư xây dựng bộ từ điển này?
Mặc dù là khái niệm mới ở Việt Nam, nhưng bộ từ điển nhà ở đã quen thuộc tại các quốc gia phát triển. Đây là kho dữ liệu tổng hợp tới 300 thuộc tính liên quan đến một BĐS như: Vị trí, diện tích, biến động giá, hướng, số phòng ngủ, tiện ích hạ tầng, tình trạng pháp lý, lịch sử giao dịch… Những trường thông tin này có tính quyết định tới giá trị của BĐS, là thông tin để người mua nhà nhận thấy có phù hợp nhu cầu hay không và đưa ra quyết định sáng suốt. Khi các thành phần tham gia giao dịch BĐS đều được tiếp cận đầy đủ và công bằng thông tin về BĐS bất kỳ, đó là thước đo cho sự minh bạch của thị trường.
Hệ sinh thái đang sở hữu kho dữ liệu của 2 triệu căn nhà được thu thập trong 10 năm qua. Mỗi BĐS hiện có 80 - 90 trường thông tin và liên tục được làm dày thêm. Có thể nói đây là bộ từ điển về nhà ở đầu tiên và quy mô của người Việt và là nguồn dữ liệu gốc để Hệ sinh thái phát triển các công cụ công nghệ, giúp người mua, người bán, tư vấn, môi giới… nắm rõ được BĐS trước khi ra quyết định giao dịch.
BĐS ở Việt Nam có nhiều loại hình đặc thù và nhiều yếu tố ảnh hưởng đến giá, nhất là với đất thổ cư. Vậy, Hệ sinh thái sẽ làm như thế nào để đảm bảo tính chính xác thông tin của từng BĐS có trong bộ từ điển?
Bộ từ điển được chia ra thành hai nhóm BĐS: BĐS trong dự án và BĐS thổ cư, mỗi căn sẽ được thu thập dựa trên hơn 300 thuộc tính.
BĐS trong dự án sẽ được thu thập những thông tin về: Dự án thuộc phân khu nào, tình trạng pháp lý, bao nhiêu tòa, chủ đầu tư là ai, đơn vị quản lý vận hành, phí quản lý, mỗi tòa nhà có bao nhiêu căn, diện tích, số phòng ngủ, số nhà vệ sinh, hướng, tầng, hướng ban công, căn góc hay ở giữa... rồi tới trên một mặt tầng có bao nhiêu căn, tòa có bao nhiêu thang máy, sử dụng thang máy của hãng nào, được bàn giao năm nào, tiện ích bên trong, bên ngoài như thế nào... Bên cạnh đó, còn có các dữ liệu về môi trường xung quanh, mức độ ô nhiễm, hạ tầng (điện, đường, trường, trạm, rạp chiếu phim, khu dịch vụ…), an ninh có biệt lập hay không, dự án được xây dựng năm nào…
BĐS đất thổ cư trong dân thì dữ liệu thu thập phức tạp hơn, ngoài các trường thông tin giống như với BĐS dự án, cần tìm hiểu các trường thông tin khác như là: Ngõ ngách như thế nào, độ rộng của ngõ, khoảng cách đến mặt đường là bao nhiêu mét, có chỗ đỗ xe hay không, nhà có bị vào quy hoạch hay không, pháp lý là đất ở, đất cho thuê hay là đất nông nghiệp, mật độ dân số có đông hay không, vị trí thửa đất, chiều dài, rộng, sâu của mảnh đất, công trình xây dựng trên đất: xây bao nhiêu tầng, diện tích xây dựng bao nhiêu, xây từ bao giờ, mặt tiền hướng nào, nhà mấy mặt tiền… Việc khảo sát trực tiếp thường được tiến hành khi chủ nhà có nhu cầu muốn bán, đơn vị môi giới, định giá sẽ tới khảo sát căn nhà và nhập lại các trường thông tin này lên hệ thống dữ liệu.
Vậy, cơ sở dữ liệu về BĐS sẽ được kiểm chứng như thế nào để đảm bảo đáng tin cậy, thưa ông?
Hệ sinh thái sử dụng cả con người và công nghệ vào việc thu thập và xử lý dữ liệu. Từ điển nhà ở được xây dựng dựa trên nhiều tài sản tham chiếu, vì vậy, đây là nguồn dữ liệu đã được xác minh thực tế qua các công ty thẩm định tài sản, ngân hàng; đồng thời, dựa trên hàng chục nghìn dữ liệu về rao bán BĐS trên thị trường mỗi ngày để tạo ra một “big data” phân tích, đưa vào mô hình máy học, những thông tin được trả về đều đã được sàng lọc và kiểm tra kỹ. Riêng dữ liệu BĐS thổ cư phải có các chuyên viên thu thập dữ liệu xác minh để đảm bảo tính chính xác của thông tin.
Vậy, theo ông, trong tương lai, tất cả các thành phần tham gia vào giao dịch, thị trường BĐS có thể sử dụng bộ từ điển như thế nào, nhất là các công nghệ hỗ trợ trong BĐS?
Các công cụ công nghệ số hóa có thể đưa ra những thông tin xác thực, là cơ sở giúp các thành phần tham gia giao dịch, thị trường BĐS có được quyết định mua bán, đầu tư chính xác. Ví dụ, trước khi quyết định đầu tư một BĐS, vấn đề nhà đầu tư quan tâm nhất là khả năng sinh lời của BĐS đó. Các thông tin Hệ sinh thái phân tích dựa trên dữ liệu từ bộ từ điển sẽ gợi mở ra khả năng dự báo về biến động giá của BĐS, phân khúc hay loại hình nào có khả năng sinh lời tốt hơn. Mở ra những cơ hội mới cho các nhà đầu tư.
Hiện nguồn dữ liệu của Hệ sinh thái chủ yếu là về dự án cao tầng, thấp tầng, tổng cộng có khoảng hơn 800.000 dự án, tập trung phần lớn tại Hà Nội, TP Hồ Chí Minh, Hưng Yên… Với BĐS thổ cư trong dân, nhà đầu tư cũng có thể tra cứu được khoảng gần 500.000 căn thổ cư tại Hà Nội, TP Hồ Chí Minh. Thời gian tới, Hệ sinh thái tiếp tục mở rộng sang BĐS thổ cư, mục tiêu đến năm 2025, bộ từ điển sẽ sở hữu dữ liệu khoảng 4 - 5 triệu căn nhà trên toàn quốc.
Xin trân trọng cảm ơn ông!