Business Intelligence (BI – Kinh doanh thông minh) là gì?

Business Intelligence là một cơ sở hạ tầng công nghệ nhằm đạt được tối đa THÔNG TIN từ hệ thống DỮ LIỆU có sẵn nhằm thúc đẩy và cải thiện  quy trình sản xuất kinh doanh của tổ chức, doanh nghiệp. Thành phần cơ bản của một cơ sở hạ tầng BI thường bao gồm hệ thống các ứng dụng để thu thập, làm sạch, tích hợp, phân tích và chia sẻ dữ liệu. BI tạo ra các thông tin đáng tin cậy và đã được phân tích nhằm giúp nhà quản trị đưa ra được những quyết định chiến lược có chất lượng và hiệu quả cao nhất có thể được.

Các hệ thống BI thông dụng nhất có thể kể đến:

  • EIS – Executive Information Systems ( hệ thống thông tin điều hành)
  • DSS – Decision Support Systems (Hệ thống hỗ trợ ra quyết định)
  • MIS – Management Information Systems (Hệ thống thông tin quản lý)
  • GIS – Geographic Information Systems(Hệ thống thông tin địa lý )
  • OLAP – Online Analytical Processing and multidimensional analysis (Xử lý dữ liệu trực tuyến và phân tích đa chiều)
  • CRM – Customer Relationship Management (Quản lý quan hệ khách hàng).
  • Một hệ thống BI thường dựa trên công nghệ Data Warehouse. Một Data Warehouse thu thập thông tin từ một tập hợp rộng lớn nhiều hệ thống thông tin khác nhau trong doanh nghiệp, BI dựa vào đó để hoàn thiện chức năng của mình. Dữ liệu được tải xuống Data Warehouse thường là dữ liệu có chất lượng đã được làm sạch và tích hợp để sản xuất ra những thông tin đáng tin cậy và phản ánh một phiên bản của sự thật về tình hình hoạt động sản xuất kinh doanh của toàn bộ doanh nghiệp.

    Nguồn: http://datawarehouse4u.info

    So sánh OLTP và OLAP

    Về cơ bản, chúng ta có thể chia dữ liệu trong một hệ thống IT thành hai mảng: Một là dữ liệu giao dịch, hai là dữ liệu phân tích. Thông thường, dữ liệu OLTP sẽ là nguồn dữ liệu cho OLAP để phục vụ cho mục đích phân tích dữ liệu chi tiết từ hệ thống OLTP thành thông tin. Hình minh họa như sau:
    Dữ liệu giao dịch gọi là OLTP (Online Transaction Processing)
    Ví dụ: một phần mềm kế toán, phần mềm bán hàng, phần mềm nhân sự, tiền lương, … được
    nhập liệu thường xuyên bởi những người dùng cuối và dữ liệu chi tiết tới từng nghiệp vụ, mô hình thiết kế theo quan hệ thực thể, database thiết kế cho hệ thống này thường được chuẩn hóa.
    Nó được đặc trưng bởi một số lượng lớn giao dịch (insert, update, delete) trong một thời gian ngắn, được thiết kế nhằm mục đích thu thập dữ liệu, duy trì tràng buộc dữ liệu trong nhiều môi trường truy cập khác nhau, đo lường hiệu quả của mô hình này chính là số lượng giao dịch trên giây.
    – Dữ liệu Phân tích là OLAP (Online Analysis Processing):  đặc trưng bởi khối lượng tương đối thấp của các giao dịch. Thay vào đó, hệ thống này thường có nhiều truy vấn để tính toán tổng hợp dữ liệu. Với hệ thống này, thời gian phản hồi yêu cầu là đơn vị đo lường cho tính hiệu quả. Ứng dụng OLAP được sử dụng rộng rãi bởi công nghệ Data Minning. Dữ liệu trong ứng dụng OLAP thường được lưu trữ dưới dạng đã được tính toán, có tính lịch sử và theo mô hình đa chiều (multi-dimensional) thường là mô hình hình sao (star schema).
    Bảng tổng hợp so sánh giữ OLTP và OLAP:

    Nội dung
    OLTP System
    (Hệ thống hoạt động)
    OLAP System
    (Data warehouse)
    Dữ liệ nguồn
    Dữ liệu hoạt động, do người dùng cuối nhập vào
    Dữ liệu hợp nhât. Dữ liệu OLAP đến từ nhiều nguồn khác nhau của hệ thống OLAP
    Mục đích của dữ liệu
    Để kiểm soát và chạy các nghiệp vụ kinh tế cơ bản, thiết yếu xảy ra hàng ngày. Phục vụ người dùng ở cấp hoạt động trong doanh nghiệp
    Phục vụ mục đích lập kế hoạch, giải quyết vấn đề, hỗ trợ ra quyết định. Phục vụ cho các cấp bậc quản lý chiến lượng.
    Phản ánh dữ liệu nào
    Cho thấy một ảnh chụp nhanh của các quá trình kinh doanh liên tục
    Số liệu cung cấp góc nhìn đa chiều các hoạt động kinh doanh trong doanh nghiệp.
    Thêm và sửa dữ liệu
    Thêm, sửa nhanh chóng và được tạo bởi người dùng cuối ở cấp hoạt động.
    Chạy theo chu kỳ, theo lô lớn các giao dịch, như vào một giờ nhất định để tập hợp, tính toán và làm mới dữ liệu.
    Truy vấn
    Liên quan đến các truy vấn cơ bản, số lượng dòng dữ liệu trả về ít.
    Thường truy vấn với các câu truy vấn tính toán phức tạp dựa trên khối lượng dữ liệu rất lớn.
    Tốc độ xử lý
    Thường rất nhanh trong một vài giây
    Phụ thuộc vào khối lượng dữ liệu cần xử lý và một lần xử lý một lô query để tập hợp và tính toán dữ liệu có thể kéo dài hàng giờ đồng hồ. Tăng tốc độ xử lý bằng cách tạo index và các kỹ thuật design chuyên nghiệp
    Không gian lưu trữ
    Tương đối nhỏ nếu dữ liệu lịch sử được cắt giảm và lưu trữ thích hợp
    Thường rất lớn, do sự tồn tại của dữ liệu tổng hợp mang tính lịch sử, cần nhiều index hơn so với OLTP
    Thiết kế database
    Chuẩn hóa ở mức cao, cần nhiều table
    Thường không cần chuẩn hóa, ít table hơn. Thường theo 2 mô hình là Star hoặc Snowflake
    Backup và phục hồi dữ liệu
    Tín đồ của backup. Dư liệu hoạt động là cực kỳ quan trọng với hoạt động kinh doanh nên phải bảo trì backup cẩn thận, việc mất mát dữ liệu cũng đồng nghĩa với việc mất mát thời gian, tiền bạc và công sức nhập liệu cũng như liên quan đến trách nhiệm pháp lý.
    Thay vì phải backup đều đặn, khi mất mát dữ liệu xảy ra, nhiều hệ thống OLAP thường chọn một phương pháp đơn giản là load lại dữ liệu từ các nguồn dữ liệu gốc ở các hệ thống OLTP như là một giải pháp phục hồi dữ liệu.

    source: http://www.rainmakerworks.com

    Data Warehouse và Business Intelligence (update ngày 17/07/2012)

    Data warehouse và BI là những khái niệm mặc dù đã có từ lâu nhưng chưa được ứng dụng rộng rãi ở Việt Nam vì giá thành và sự phức tạp của nó, cũng như số lượng các DN có quy mô dữ liệu bắt buộc phải sử dụng data warehouse và BI thực sự chưa nhiều. Theo hiểu biết cá nhân thì trong các trường đại học cũng chỉ mới bắt đầu đưa vào giảng dạy trong vài năm trở lại đây.
    Để hiểu được những khái niệm (tạm gọi là cao cấp trong mảng database) này, đòi hỏi người triển khai phải có kiến thức và trải nghiệm thực tế trước khi làm quen và xây dựng những hệ thống như thế. Thông thường, các tài liệu viết về những khái niệm này khá trừu tượng, khó tiếp cận cho những người mới bắt đầu làm quen. Loạt bài viết này không có tham vọng gì lớn ngoài việc cùng trao đổi và chuyển tải một số hiểu biết về data warehouse và BI tới người đọc, đặc biệt những người mới làm quen với những khái niệm này.


    Data warehouse là gì?


    Data warehouse được sử dụng như là một nền tảng cho hệ thống hỗ trợ ra quyết định. Nó gắn liền với khái niệm Business Inteligence (Kinh doanh thông minh). Nó được dùng để giải quyết các vấn đề gặp phải khi một tổ chức cố gắng phân tích chiến lược từ số liệu trong một hệ thống database được dùng chung với hệ thống xử lý dữ liệu trực tuyến (Online Transaction Processing – OLTP).
    Một hệ thống OLTP điển hình được đặc trưng bởi một hệ thống có nhiều người sử dụng đồng thời để thêm, sửa, xóa dữ liệu. Ví dụ như một hệ thống bán lẻ, có nhiều nhân viên bán hàng đồng thời cùng nhập và chỉnh sửa dữ liệu vào hệ thống. Trong một hệ thống nhỏ, việc sử dụng cùng một hệ thống database này cho mục đích lên báo cáo thống kê, phân tích có thể chấp nhận được do khối lượng dữ liệu ít, ít người dùng. Nhưng trong một hệ thống với khối lượng dữ liệu hàng chục triệu đến trăm triệu bản ghi trên một bảng thì việc khai thác dữ liệu chung trên cùng một hệ thống database OLTP là không thể chấp nhận được vì thời gian xử lý dữ liệu rất lâu, làm cho tài nguyên hệ thống trở nên quá tải và có thể làm cho toàn bộ hệ thống bị tê liệt.

    Đọc thêm »