Hầu hết các doanh nghiệp đều xác định được tầm quan trọng của dữ liệu trong quá trình chuyển đổi số,ệpViệtcóthểthuthậpdữliệutheokiểuvenhệnhaycákeonhacai.com 5 phát triển công ty. Song không ít người chưa hiểu rõ cách xây dựng dữ liệu, xác định dữ liệu nào cần sử dụng, và áp dụng dữ liệu như thế nào để hiệu quả.
Hiểu thế nào về dữ liệu lớn?
Trong sự kiện Vietnam Data Summit 2022 mới đây, ông Albert Antoine - chuyên gia ngành khoa học dữ liệu và trí tuệ nhân tạo, đồng sáng lập công ty Avaiga - đã giải đáp những thắc mắc nói trên, đồng thời đưa ra một số lời khuyên cho doanh nghiệp trên hành trình chuyển đổi số.
Vị chuyên gia Việt kiều cho rằng dữ liệu hiện có mặt khắp mọi nơi, trong đó, chiếc smartphone mọi người đang sử dụng chính là vật thu thập dữ liệu phổ biến nhất.
Song, để xây dựng dữ liệu lớn, cần xác định rõ các tiêu chí ngay từ đầu. Về cơ bản, big data được định nghĩa xoay quanh 5 chữ V. Đầu tiên, khối lượng (volume) dữ liệu phải đủ lớn. Chẳng hạn, mỗi ngày hệ thống bán lẻ Walmart tại Mỹ tạo ra khối dữ liệu khoảng 24-25 TB (trong khi chiếc smartphone mạnh nhất hiện nay có dung lượng lưu trữ tối đa 1TB).
Tiếp đến, dữ liệu phải có tính đa dạng (variety), từ hình ảnh, âm thanh, chữ viết,... đến video, bài viết. Việc thu thập, khai thác dữ liệu cũng cần dựa trên yếu tố tốc độ (velocity), chẳng hạn khi vận hành xe tự lái thì khối lượng dữ liệu thu thập và xử lý phải được thực hiện theo thời gian thực để giúp xe xử lý tình huống ngay tức khắc.
Thêm vào đó, dữ liệu thu thập phải chính xác (veracity), vì nếu thu thập sai sẽ dẫn đến kết quả sai. Do đó, người ta phải tốn đến 80% công sức cho việc “làm sạch” dữ liệu trước khi đem vào sử dụng. Cuối cùng, dữ liệu phải có giá trị (value).
Ông Albert Antoine đang trình bày tại sự kiện Vietnam Data Summit 2022. (Ảnh: Hải Đăng) |
Chiến lược thu thập dữ liệu của nhện và cáo
Sau khi đã xác định được tầm quan trọng của dữ liệu và loại dữ liệu cần thu thập, có 3 cách để lấy được dữ liệu.
Với doanh nghiệp chưa từng có cơ sở dữ liệu thì cần phải đi xin, hoặc đi mua dữ liệu. Cách này được ông Antoine ví von như kiểu của con ve trong truyện ngụ ngôn: mùa hè con ve mải lo ca hát nên mùa đông không có thức ăn, phải xin của con kiến vốn cần cù làm lụng quanh năm.
Ở cách thứ hai, một số doanh nghiệp áp dụng nguyên tắc con nhện giăng tơ, tức cung cấp các dịch vụ để khách hàng sử dụng, từ đó thu thập dữ liệu. Chẳng hạn, khi bạn dùng Wi-Fi công cộng miễn phí thường phải cung cấp địa chỉ email - cũng là một dạng dữ liệu.
Những doanh nghiệp có sẵn cơ sở hạ tầng tiên tiến sẽ áp dụng nguyên tắc của con cáo: cung cấp công cụ phân tích cho những người sở hữu sẵn dữ liệu, sau đó dùng kết quả phân tích để bán cho bên có nhu cầu. Ví dụ các doanh nghiệp toàn cầu như Facebook, Google đang áp dụng cả chiến lược của nhện lẫn cáo.
“Khi đọc sách Kindle của Amazon, bạn tưởng bạn đang đọc sách nhưng thực ra sách đang “đọc” bạn”, vị chuyên gia từng tư vấn cho nhiều doanh nghiệp và chính phủ ví von.
Ông ám chỉ việc mỗi lần bạn dừng lại, đọc lâu hơn một đoạn nào đó chính là đang cung cấp hành vi để máy thu thập dữ liệu.
Thế giới đang dùng dữ liệu vào việc gì?
Sau khi đã có dữ liệu lớn, trên thế giới hiện nay có nhiều xu hướng sử dụng. Dễ thấy nhất là mô hình bot/công nhân số. Nhờ dữ liệu lớn và máy học, các doanh nghiệp xây dựng nên những con bot để giao tiếp với khách hàng trên mạng. Tại Việt Nam hay trên toàn cầu, khi bạn chat với tổng đài, thường là bạn đang trò chuyện với hệ thống máy tính (bot). Các con bot hiện nay khá thông minh, thậm chí có thể chốt đơn hàng mà không cần con người can thiệp vào.
Ngoài ra, các thông tin thu thập có thể dùng trong ngành phân tích dữ liệu. Qua hệ thống máy tính, dữ liệu có thể dùng vào việc phân tích các sự kiện đã diễn ra, chẳng hạn đưa ra các kết quả kinh doanh phục vụ doanh nghiệp. Nếu áp dụng AI/ML, có thể dự báo được những xu hướng kinh doanh, những sự việc xảy ra tiếp đến. Các thuật toán cũng có thể đưa ra lời khuyên để hỗ trợ con người đưa ra các hành động tiếp theo.
Mặc dù rất nhiều doanh nghiệp đã nhận ra được tầm quan trọng của dữ liệu trong quá trình chuyển đổi số, song không phải doanh nghiệp nào cũng đi đúng lộ trình.
“Nhiều doanh nghiệp cho rằng chuyển đổi số chỉ cần mua phần mềm về là xong, nhưng thực tế không phải vậy. Điều quan trọng là sự sắp xếp vận hành của doanh nghiệp trong quá trình thay đổi của công ty”, ông Antoine nhấn mạnh.
Vị chuyên gia cho rằng trong quá trình chuyển đổi số và xây dựng dữ liệu, mọi người đều phải tham gia. Thông thường, giữa các bộ phận và các đơn vị trong một tổ chức không chịu chia sẻ dữ liệu với nhau, vì nó không thuộc phạm vi công việc của họ. Do đó, cần đưa nội dung hợp tác và chia sẻ dữ liệu như một nhiệm vụ trong công việc hàng ngày để nhân viên làm việc.
Ngoài ra, để có được dữ liệu, doanh nghiệp cần cung cấp công cụ công nghệ cho nhân viên. Vì nếu không hoạt động trên nền tảng công nghệ thì không thể nào sản sinh ra dữ liệu.
Cuối cùng, để xây dựng dữ liệu thì những nhà lãnh đạo phải xác định doanh nghiệp xoanh quanh dữ liệu. Phải truyền đạt rõ ràng và minh bạch với nhân viên ngay từ đầu để nâng cao ý thức cho họ. Từ đó, mọi người đều chuyên tâm vào việc xây dựng và sản sinh dữ liệu.
Hải Đăng
Meta bị kiện vì thu thập dữ liệu từ hơn 600 bệnh viện và nhà cung cấp dịch vụ y tế
Tờ Bloomberg đưa tin, Meta vừa bị đệ đơn kiện với cáo buộc cho phép dữ liệu y tế riêng tư được chia sẻ bí mật với Facebook mỗi khi bệnh nhân truy cập website của một số nhà cung cấp dịch vụ chăm sóc sức khỏe.