5 yêu cầu quan trọng đối với một dự án dữ liệu lớn

07:09, 29/05/2016

Amy Gaskins, một nhà khoa học dữ liệu với hơn một chục năm kinh nghiệm, đã chia sẻ 5 yêu cầu quan trọng dành cho những dự án dữ liệu lớn.

Dự án dữ liệu lớn thành công cần 5 yêu cầu quan trọng, theo Amy Gaskins, một nhà khoa học dữ liệu với hơn 10 năm kinh nghiệm thiết kế và thực thi các dự án dữ liệu và nghiên cứu cho các công ty tư nhân, công ty nhà nước và quân đội Mỹ.

Trong bài phát biểu tại hội nghị dữ liệu lớn khu vực Bắc Mỹ ở Vancouver ngày thứ Hai vừa qua, Gaskin đã nhấn mạnh 5 yếu tố có thể tạo nên hoặc phá hỏng những dự án dữ liệu lớn: 

  • Sự cam kết. Một điều cần phải thừa nhận là các dự án dữ liệu lớn cần sự cam kết từ cấp lãnh đạo cao cấp để thành công. Nhưng Gaskins nói điều đó vẫn chưa đủ. Bạn cần sự cam kết ở mọi cấp, bao gồm quản lý cấp trung và ở cấp thấp nhất là nhân viên. “Bạn cần có sự cam kết từ cấp lãnh đạo, và cả ở cấp trung và cấp cấp thấp nữa. Tại sao ư? Bạn phải có sự đồng thuận.”
  • Khẩn trương. “Bạn có nhận thấy những rủi ro đang đe doạ công ty và sứ mệnh của bạn nếu bạn không có tinh thần khẩn trương?”
  • Minh bạch. “Liệu mọi người trong và ngoài công ty có biết rõ những gì chúng ta đang làm và vì sao?”
  • Sự tham gia của các chuyên gia chủ đề, lĩnh vực khoa học phi dữ liệu. Các chuyên gia này là những người hiểu rõ lĩnh vực của mình. Họ sẽ cung cấp các bối cảnh giúp bạn hiểu dữ liệu nói gì. “Chuyên gia chủ đề, lĩnh vực khoa học phi dữ liệu sẽ chính là những người ngăn chặn sự xung đột giữa CNTT và kinh doanh. Họ tạo ra phép màu, và tôi không thể nói họ ít quan trọng.”
  • Sự an toàn về tâm lý. Các thành viên của nhóm, các nhà khoa học dữ liệu và các chuyên gia chủ đề cần phải tin tưởng lẫn nhau. “Khi chúng tôi nói về những yêu cầu để thành công, chúng tôi nghĩ về tháp nhu cầu của Maslow. Nhưng sự thật đó thực sự là một hệ thống hay bất cứ phần nào của hệ thống có thể chia nhỏ.”

Gaskins, người từng nhiều năm làm Giám đốc dự án dữ liệu lớn tại Hiệp hội khí quyển và đại dương quốc gia (NOAA), chia sẻ 3 kinh nghiệm cá nhân như từng giúp Lữ đoàn 43 ở Afghanistan loại bỏ được tình trạng tham nhũng dẫn đến việc các nguồn lực rơi vào tay của Taliban; giúp văn phòng tại Dubai của MetLife xây dựng một giải pháp tự động cho việc phát hiện các hiện tượng lừa đảo và giúp NOAA mở và thương mại hoá dữ liệu thời tiết của mình.

2 dự án đầu đã đáp ứng được cả 5 tiêu chí mà bà vạch ra ở trên và đã chứng tỏ sự thành công. Ở Afghanistan, Gaskins, một thời từng là sĩ quan tình báo quân đội, đã phục vụ như một cố vấn cho Chỉ huy an ninh và tình báo quân đội Mỹ. Bà đã làm việc cho Lữ đoàn 43 khi viên sĩ quan tình báo của lữ đoàn này quay trở về Mỹ. Lữ đoàn có 5000 lính, nhưng bộ phận tình báo chỉ có 6 người. Gaskins đã giúp triển khai một chương trình sử dụng các lái xe tải và những người khác thu thập tin tức tình báo mà bộ phận này sau đó có thể phân tích các bằng chứng tham nhũng và hối lộ.

Làm việc với MetLife ở Dubai, Gaskin đã giúp xây dựng một giải pháp tự động phát hiện lừa đảo mà sau đó mang lại tỷ lệ hoàn vốn tới hơn 400%. Dự án đã mở ra lối tiếp cận dữ liệu của NOAA cho công chúng, dù các tổ chức có được thành công là những người đã từng tiếp cận trái phép các chuyên gia chủ đề của NOAA.

“Đó là một nhóm theo chủ nghĩa quân bình, không có chức vụ và nó cho phép mọi người ra quyết định rất dễ dàng. Tất cả chúng tôi đều cởi mở, minh bạch và điều này làm cho nhóm thực sự an toàn.”

Cẩm Thịnh