Dữ liệu kiểm soát thời gian là gì

Hỏi đáp CNTT 27/09/2021

Các chuyên gia công nghệ thông tin mảng dữ liệu đang được săn đón trong tất cả các ngành với các vị trí quản lý dữ liệu – một trong số những nghề đang phát triển nhanh nhất. Cho dù ở lĩnh vực nào đi chăng nữa từ sản xuất, tài chính hay chăm sóc sức khỏe, bảo hiểm,… thì dữ liệu lớn đều rất cần thiết đối với các chuyên gia.

Ngày nay với sự trợ giúp của hệ thống quản lý dữ liệu, nhiều thách thức trong các lĩnh vực công việc đã được giải quyết nhanh chóng. Trong bài viết này, hãy cùng khám phá những gì liên quan đến hệ thống quản lý dữ liệu.

Quản lý dữ liệu là gì?

Quản lý dữ liệu làm việc với các thông lệ, kế hoạch, chương trình và chính sách nhằm bảo vệ, kiểm soát và nâng cao giá trị của thông tin và tài sản dữ liệu thông qua dòng dữ liệu của hệ thống thông tin từ khi tạo đến khi lưu trữ ban đầu đến khi nó trở nên lỗi thời và cuối cùng bị xóa.

Lợi ích của quản lý dữ liệu

Thông qua các thủ tục và chính sách, quản lý dữ liệu cung cấp cho các tổ chức quyền kiểm soát dữ liệu của doanh nghiệp. Với việc quản lý dữ liệu thích hợp, sẽ giảm thiểu tối đa các trường hợp vi phạm bảo mật và cắt giảm chi phí tuân thủ pháp luật và quy định. Quản lý dữ liệu cho phép các công ty truy cập dữ liệu chính xác ở bất cứ đâu hoặc bất cứ khi nào nó được yêu cầu và hơn nữa khả năng thông tin sai lệch ở mức tối thiểu.

Hệ thống quản lý dữ liệu lớn [big data management] xử lý rất nhiều dữ liệu có nhiều cấu trúc khác nhau — nhiều hơn so với dữ liệu truyền thống. Dữ liệu được thu thập nhanh chóng, hãy tưởng tượng tốc độ dữ liệu được thu thập từ các nền tảng được tính bằng phút, chẳng hạn như các nguồn mạng xã hội. Dữ liệu lớn rất có lợi cho các tổ chức vì sự đa dạng về số lượng và tốc độ của dữ liệu được thu thập.

Quản lý dữ liệu lớn cho phép tích hợp các loại dữ liệu khác nhau để người quản trị có thể chuyển đổi thông tin cho con người. Dữ liệu được lưu trữ, xử lý và phân tích để khám phá ra những hiểu biết mới, thường là với sự trợ giúp của trí tuệ nhân tạo [AI] và học máy [machine learning].

Dữ liệu lớn có thể đẩy nhanh quá trình phát triển sản phẩm, đó là lý do tại sao nó được nhiều công ty sử dụng. Nó cũng có thể cải thiện trải nghiệm khách hàng, tăng hiệu quả hoạt động và tính bảo mật cao. Dữ liệu lớn ngày càng phát triển, và cơ hội cho việc quản lý dữ liệu cũng vậy.

Mục đích của quản lý dữ liệu 

Hệ thống quản lý dữ liệu kiểm soát dữ liệu rất hiệu quả trên một cấp dữ liệu thống nhất — mặc dù dữ liệu rất đa dạng. Các nền tảng quản lý dữ liệu mà hệ thống quản lý dữ liệu được xây dựng, bao gồm:

Nghiên cứu về việc lấy dữ liệu thô và sử dụng các kỹ thuật để đưa ra kết luận hoặc khám phá các xu hướng và số liệu nhằm giúp tối ưu hóa và tăng hiệu quả tổng thể của một doanh nghiệp.

Bộ sưu tập dữ liệu có tổ chức có thể truy cập điện tử từ hệ thống máy tính.

Hệ thống này chứa khối lượng lớn dữ liệu có cấu trúc và phi cấu trúc để đảm bảo chất lượng thông tin cao cấp cho phân tích và thông tin kinh doanh.

Kho lưu trữ dữ liệu gồm các dữ liệu có cấu trúc đã được lọc và xử lý cho một mục đích xác định.

Ở đây, một lượng lớn dữ liệu thô chưa được cung cấp cho một mục đích cụ thể.

Các thành phần quản lý dữ liệu trên đóng vai trò là tiện ích dữ liệu, rất cần thiết cho các ứng dụng của công ty cũng như các thuật toán và phân tích sử dụng dữ liệu do ứng dụng mà họ tạo ra. Sự can thiệp thủ công vẫn được yêu cầu, mặc dù các quản trị viên cơ sở dữ liệu có các công cụ tự động hóa phần lớn các tác vụ quản lý truyền thống.

Sẽ có khả năng xảy ra sai sót nếu quản lý thủ công, vì vậy cần đặt cơ sở dữ liệu tự quản lên hàng đầu trong công nghệ quản lý dữ liệu mới, nhằm giảm nhu cầu quản lý dữ liệu thủ công.

Cách hệ thống quản lý dữ liệu vận hành

Quản lý dữ liệu liên quan đến một phạm vi rộng của các thông lệ, nhiệm vụ, thủ tục và chính sách. Nó bao gồm các yếu tố như:

  • Đảm bảo tính bảo mật và quyền riêng tư của dữ liệu.
  • Tạo, cập nhật và truy cập dữ liệu qua một cấp dữ liệu đa dạng.
  • Sử dụng dữ liệu ngày càng tăng cho việc phân tích, ứng dụng và thuật toán.
  • Lưu trữ dữ liệu trên nhiều cơ sở và hệ thống điện toán đám mây khác nhau.
  • Cung cấp khả năng phục hồi sau những rủi ro lớn và tính sẵn sàng cao.
  • Lưu trữ và xóa dữ liệu tuân theo các yêu cầu và lịch trình lưu giữ.

Chiến lược sử dụng quản lý dữ liệu gồm hoạt động của quản trị viên và người dùng, các yêu cầu quy định, khả năng của công nghệ quản lý dữ liệu và nhu cầu của một công ty nhằm mục đích có được lợi ích từ dữ liệu của mình.

Các phương pháp tốt nhất cho hệ thống quản lý dữ liệu

Trong vài năm qua, lượng dữ liệu được tích lũy đã và đang tăng lên rất nhiều. Ngoài khối lượng dữ liệu, còn có những thách thức khác mà các tổ chức phải đối mặt khi quản lý dữ liệu, chẳng hạn như phân quyền, phân phối dữ liệu và bảo mật,… Cần phải có các phương pháp tốt và toàn diện nhất để tiếp cận những thách thức về quản lý dữ liệu.

Tùy thuộc vào đặc thù hoạt động của các ngành công nghiệp với loại dữ liệu liên quan mà xác định các phương pháp tốt nhất. Tuy nhiên, dưới đây là các phương pháp tốt nhất để giải quyết một số thách thức chính mà các công ty phải đối mặt với việc quản lý dữ liệu bạn có thể tham khảo:

Với công nghệ mới, lớp truy vấn tiêu chuẩn bao gồm các loại lưu trữ dữ liệu khác nhau sẽ cho phép các nhà phân tích, nhà khoa học dữ liệu và ứng dụng có quyền truy cập vào dữ liệu loại bỏ nhu cầu nhận biết vị trí của nó và sự cần thiết phải chuyển đổi theo cách thủ công thành một định dạng có thể sử dụng được.

Dữ liệu có thể trở nên hữu dụng hơn bởi các nhà khoa học và nhà phân tích dữ liệu với lớp khám phá được tạo bên trên lớp dữ liệu của công ty.

Khi các truy vấn thay đổi, các chỉ mục sẽ cần tối ưu hóa và khả năng dữ liệu tự trị có thể sử dụng AI và học máy để theo dõi các truy vấn cơ sở dữ liệu một cách liên tục. Do đó, cơ sở dữ liệu sẽ giữ được thời gian phản hồi nhanh chóng, từ đó, các quản trị viên cơ sở dữ liệu và các nhà khoa học dữ liệu sẽ không có nhiều tác vụ tốn thời gian như vậy.

Công việc chuyển đổi dữ liệu được tự động hóa trong môi trường khoa học dữ liệu cần được diễn ra nhiều nhất có thể. Ngoài ra, quá trình tạo và đánh giá mô hình dữ liệu có thể được sắp xếp hợp lý. Bằng cách sử dụng các công cụ cụ thể, các tổ chức có thể loại bỏ nhu cầu chuyển đổi dữ liệu theo cách thủ công, điều này có thể đẩy nhanh các nhiệm vụ giả thuyết và thử nghiệm các mô hình dữ liệu mới.

Kết luận

Bởi quản lý dữ liệu đóng một vai trò quan trọng trong nền kinh tế kỹ thuật số ngày nay, do đó việc các hệ thống phải tiếp tục phát triển để đáp ứng nhu cầu dữ liệu của các tổ chức là rất cần thiết. Quản lý dữ liệu hiệu quả giúp giảm thiểu các lỗi tiềm ẩn và giảm thiệt hại do dữ liệu xấu gây ra. Do đó, một chiến lược quản lý dữ liệu hiệu quả và sáng kiến ​​về chất lượng dữ liệu phải được thực hiện để kiểm soát tốt hơn sức khỏe của tài sản quý giá nhất của doanh nghiệp. 

Lương Thuận – dịch từ Indeed

Các tùy chọn kiểm soát Lưu giữ dữ liệu Google Analytics cho phép bạn đặt thời hạn lưu giữ dữ liệu cấp người dùng và cấp sự kiện trên Google Analytics trước khi hệ thống tự động xóa những dữ liệu đó khỏi các máy chủ của Analytics.

Lưu giữ dữ liệu người dùng và sự kiện

Khoảng thời gian lưu giữ này áp dụng cho dữ liệu ở cấp người dùng và cấp sự kiện được liên kết với các cookie, giá trị nhận dạng người dùng [ví dụ: User-ID] và giá trị nhận dạng quảng cáo [ví dụ: cookie DoubleClick, Mã nhận dạng cho quảng cáo của Android [AAID hoặc AdID], Giá trị nhận dạng của Apple dành cho nhà quảng cáo [IDFA]].

Mặc dù khoảng thời gian lưu giữ và tùy chọn kiểm soát việc đặt lại hoạt động của người dùng có áp dụng cho dữ liệu ở cấp sự kiện và cấp người dùng mà Google Analytics lưu trữ, nhưng theo mặc định, Google Analytics vẫn sẽ xóa một số dữ liệu chính của người dùng [chẳng hạn như độ tuổi, giới tính, mối quan tâm] nếu một người dùng cụ thể không có hoạt động gì trong 6 tháng đối với thuộc tính Universal Analytics hoặc trong 2 tháng đối với thuộc tính Google Analytics 4.

Bạn có thể chọn thời hạn Analytics lưu giữ dữ liệu trước khi tự động xóa.

Analytics sẽ lưu giữ dữ liệu Google Tín hiệu trong tối đa 26 tháng, bất kể thời hạn mà bạn đã đặt. Theo mặc định, dữ liệu đăng nhập bằng Google sẽ hết hạn sau 26 tháng. Tuy nhiên, nếu bạn đặt thời gian Lưu giữ dữ liệu trên Analytics ngắn hơn 26 tháng, thì dữ liệu khi đăng nhập vào Tài khoản Google sẽ được lưu giữ trong khoảng thời gian mà bạn đặt.

Thuộc tính Google Analytics 4

Đối với thuộc tính Google Analytics 4 [không phải phiên bản Analytics 360], bạn có thể đặt thời hạn lưu giữ dữ liệu ở cấp người dùng [bao gồm cả lượt chuyển đổi] tối đa là 14 tháng. Đối với tất cả dữ liệu sự kiện khác, bạn có thể chọn thời hạn lưu giữ là:

Tìm hiểu thêm về các tùy chọn giữ lại dữ liệu đối với Analytics 360

Dữ liệu về độ tuổi, giới tính và sở thích luôn được lưu giữ trong 2 tháng mà không phụ thuộc vào chế độ cài đặt của bạn.

Khi bạn tăng thời hạn lưu giữ, thời hạn mới sẽ áp dụng cho dữ liệu mà bạn đã thu thập.

Tài sản có kích thước XL chỉ được lưu giữ dữ liệu trong 2 tháng.

Xin lưu ý rằng chế độ cài đặt giữ lại dữ liệu không ảnh hưởng đến báo cáo tổng hợp chuẩn trong tài sản Google Analytics 4, ngay cả khi bạn tạo các bảng so sánh trong báo cáo. Chế độ cài đặt giữ lại dữ liệu chỉ ảnh hưởng đến báo cáo Khám phá.  

Tài sản Universal Analytics

Đối với thuộc tính Universal Analytics, chế độ cài đặt lưu giữ dữ liệu áp dụng cho cả dữ liệu ở cấp người dùng và ở cấp sự kiện. Bạn có thể chọn:

  • 14 tháng
  • 26 tháng
  • 38 tháng
  • 50 tháng
  • Không tự động hết hạn

Tuy nhiên, việc tăng khoảng thời gian lưu giữ hoặc thay đổi khoảng thời gian này thành Không tự động hết hạn không ảnh hưởng đến dữ liệu mà bạn đã thu thập. Ví dụ: ngay cả khi bạn thay đổi thời hạn lưu giữ thành 26 tháng, hệ thống vẫn xóa những dữ liệu đã thu thập có thời hạn lưu giữ là 14 tháng sau khi lưu giữ đủ 14 tháng.

Lưu ý rằng báo cáo Google Analytics tổng hợp chuẩn không bị ảnh hưởng. Dữ liệu ở cấp người dùng và ở cấp sự kiện được quản lý bằng chế độ cài đặt này chỉ cần thiết khi bạn sử dụng một số tính năng nâng cao nhất định [như tính năng áp dụng phân đoạn tùy chỉnh cho báo cáo hoặc tính năng tạo báo cáo tùy chỉnh bất thường].

Giảm hoặc tăng thời hạn lưu giữ

Khi hết thời hạn lưu giữ dữ liệu, hệ thống sẽ tự động xóa dữ liệu đó hằng tháng.

Nếu bạn thay đổi khoảng thời gian lưu giữ thì dữ liệu chịu ảnh hưởng sẽ bị xóa trong lần xóa hàng tháng tiếp theo. Ví dụ: nếu bạn thay đổi thời hạn lưu giữ từ 26 tháng thành 14 tháng, những dữ liệu được lưu giữ quá 14 tháng cũng sẽ bị xóa trong lần xóa hằng tháng tiếp theo.

Nếu bạn tăng thời hạn lưu giữ hoặc thay đổi thời hạn này thành Không tự động hết hạn cho thuộc tính Universal Analytics, thì việc này cũng không ảnh hưởng đến dữ liệu mà bạn đã thu thập. Ví dụ: ngay cả khi bạn thay đổi thời hạn lưu giữ thành 26 tháng, hệ thống vẫn xóa những dữ liệu đã thu thập có thời hạn lưu giữ là 14 tháng sau khi lưu giữ đủ 14 tháng. Nếu bạn tăng thời hạn lưu giữ cho thuộc tính Google Analytics 4, hệ thống sẽ áp dụng thay đổi này cho dữ liệu mà bạn đã thu thập.

Mỗi khi bạn sửa đổi thời hạn lưu giữ, Analytics sẽ đợi 24 giờ trước khi áp dụng thay đổi này. Trong 24 giờ này, bạn có thể hủy thay đổi và dữ liệu của bạn sẽ không bị ảnh hưởng.

Nếu bạn sử dụng phạm vi ngày cho báo cáo không phải báo cáo tổng hợp [ví dụ: Báo cáo Khám phá trong Google Analytics 4] dài hơn thời gian giữ lại, thì dữ liệu trong thời gian bổ sung đó sẽ không hiển thị trong các báo cáo. Ví dụ: nếu bạn đặt thời hạn giữ lại thành 14 tháng và sử dụng phạm vi ngày là 14 tháng + 1 ngày, thì dữ liệu trong 1 ngày bổ sung đó sẽ không có trong các báo cáo của bạn.

Thiết lập lại hoạt động mới

BẬT tùy chọn này để đặt lại thời hạn lưu giữ các giá trị nhận dạng người dùng tương ứng với mỗi sự kiện mới của người dùng đó [qua đó đặt ngày hết hạn bằng thời điểm hiện tại cộng với thời hạn lưu giữ]. Ví dụ: nếu bạn đặt thời hạn lưu giữ là 14 tháng nhưng nếu một người dùng bắt đầu phiên hoạt động mới hàng tháng thì giá trị nhận dạng của người dùng đó sẽ được làm mới hàng tháng và không bao giờ đạt tới thời hạn 14 tháng. Nếu người dùng đó không bắt đầu phiên hoạt động mới trước khi thời hạn lưu giữ kết thúc thì dữ liệu của người dùng đó sẽ bị xóa.

Nếu bạn không muốn đặt lại thời hạn lưu giữ cho một giá trị nhận dạng người dùng khi người dùng đó có hoạt động mới, hãy TẮT tùy chọn này. Dữ liệu gắn liền với giá trị nhận dạng người dùng đó sẽ tự động bị xóa sau khoảng thời gian lưu giữ.

Tính năng đặt lại chỉ áp dụng cho dữ liệu cấp người dùng.

Đặt các tùy chọn

  1. Đăng nhập vào Google Analytics..
  2. Nhấp vào mục Quản trị và chuyển đến thuộc tính mà bạn muốn chỉnh sửa.
  3. Đối với thuộc tính web: Trong cột THUỘC TÍNH, hãy nhấp vào Thông tin theo dõi > Lưu giữ dữ liệu.
    Đối với thuộc tính Google Analytics 4: Trong cột THUỘC TÍNH, hãy nhấp vào Cài đặt dữ liệu > Lưu giữ dữ liệu.
  4. Đối với thuộc tính web: Lưu giữ dữ liệu người dùng và sự kiện: chọn khoảng thời gian lưu giữ mà bạn muốn.
    Đối với thuộc tính Google Analytics 4: Lưu giữ dữ liệu sự kiện: chọn khoảng thời gian lưu giữ mà bạn muốn.
  5. Đối với thuộc tính web: Đặt lại đối với hoạt động mới: bật hoặc tắt nút chuyển.
    Đối với thuộc tính Google Analytics 4: Đặt lại dữ liệu người dùng đối với hoạt động mới: bật hoặc tắt nút chuyển.
  6. Nhấp vào Lưu.

Lưu giữ dữ liệu và chỉ số Người dùng

Kể từ tháng 2 năm 2018, chúng tôi đã thêm chỉ số Người dùng vào nhiều báo cáo khác. Vì đây là chỉ số mới trong các báo cáo, nên chúng tôi chưa có dữ liệu tổng hợp về chỉ số này cho tất cả các báo cáo này ở mọi thời điểm. Điều này có thể ảnh hưởng đến báo cáo lịch sử của bạn: bạn có thể thấy Số người dùng bằng 0 trước khi chúng tôi có dữ liệu tổng hợp cho chỉ số đó.

Chúng tôi đã bắt đầu tổng hợp dữ liệu cho thuộc tính 360 vào ngày 1 tháng 5 năm 2016 và cho các thuộc tính chuẩn vào ngày 1 tháng 9 năm 2016.

Tuy nhiên, điều này không ảnh hưởng đến báo cáo Tổng quan về đối tượng, trong đó có Dữ liệu tổng hợp của người dùng trong một khoảng thời gian dài hơn.

Video liên quan

Chủ Đề