Data Warehouse và Business Intelligence (update ngày 17/07/2012)

Data warehouse và BI là những khái niệm mặc dù đã có từ lâu nhưng chưa được ứng dụng rộng rãi ở Việt Nam vì giá thành và sự phức tạp của nó, cũng như số lượng các DN có quy mô dữ liệu bắt buộc phải sử dụng data warehouse và BI thực sự chưa nhiều. Theo hiểu biết cá nhân thì trong các trường đại học cũng chỉ mới bắt đầu đưa vào giảng dạy trong vài năm trở lại đây.
Để hiểu được những khái niệm (tạm gọi là cao cấp trong mảng database) này, đòi hỏi người triển khai phải có kiến thức và trải nghiệm thực tế trước khi làm quen và xây dựng những hệ thống như thế. Thông thường, các tài liệu viết về những khái niệm này khá trừu tượng, khó tiếp cận cho những người mới bắt đầu làm quen. Loạt bài viết này không có tham vọng gì lớn ngoài việc cùng trao đổi và chuyển tải một số hiểu biết về data warehouse và BI tới người đọc, đặc biệt những người mới làm quen với những khái niệm này.


Data warehouse là gì?


Data warehouse được sử dụng như là một nền tảng cho hệ thống hỗ trợ ra quyết định. Nó gắn liền với khái niệm Business Inteligence (Kinh doanh thông minh). Nó được dùng để giải quyết các vấn đề gặp phải khi một tổ chức cố gắng phân tích chiến lược từ số liệu trong một hệ thống database được dùng chung với hệ thống xử lý dữ liệu trực tuyến (Online Transaction Processing – OLTP).
Một hệ thống OLTP điển hình được đặc trưng bởi một hệ thống có nhiều người sử dụng đồng thời để thêm, sửa, xóa dữ liệu. Ví dụ như một hệ thống bán lẻ, có nhiều nhân viên bán hàng đồng thời cùng nhập và chỉnh sửa dữ liệu vào hệ thống. Trong một hệ thống nhỏ, việc sử dụng cùng một hệ thống database này cho mục đích lên báo cáo thống kê, phân tích có thể chấp nhận được do khối lượng dữ liệu ít, ít người dùng. Nhưng trong một hệ thống với khối lượng dữ liệu hàng chục triệu đến trăm triệu bản ghi trên một bảng thì việc khai thác dữ liệu chung trên cùng một hệ thống database OLTP là không thể chấp nhận được vì thời gian xử lý dữ liệu rất lâu, làm cho tài nguyên hệ thống trở nên quá tải và có thể làm cho toàn bộ hệ thống bị tê liệt.

Đọc thêm »

Chạy backup database từ file bat

Trong môi trường phát triển một ứng dụng mới, database của bạn sẽ thường xuyên phải chỉnh sửa cấu trúc, dữ liệu. 
Hoặc hàng ngày bạn phải lặp đi lặp lại nhiệm vụ backup database của công ty hoặc của khách hàng.
Phiên bản SQL bạn sử dụng lại là phiên bản SQL 2008 Express không có SQL Agent để tự động chạy Job thực hiện việc bakup database. Bạn sẽ thực hiện công việc tự động này bằng cách sử dụng Task Scheduler có sẵn của Window.
Bạn không muốn mở SQL Management Studio hoặc ứng dụng của bạn lên chỉ để thực hiện một chức năng duy nhất là backup một database nào đó của công ty.
Tất cả những gì bạn muốn là double click lên một file .bat và nó sẽ thực hiện chạy một câu lệnh sql bất kỳ cho bạn, cụ thể trong bài này là thực hiện một Procedure làm công việc backup database.

Chúng ta sẽ sử dụng sqlcmd để thực hiện công việc trên.

Đọc thêm »