Seminar khoa học “Tách biệt các mối liên quan trong xây dựng mô hình dịch tễ học”

Thời gian bắt đầu: 12:00 am 13/03/2017

Thời gian kết thúc: 12:00 am 13/03/2017

Địa điểm: P.803 - Nhà B1 - Đại học BKHN

Thời gian: 14.30 ngày thứ 2, 13/3/2017

Người trình bày: TS. Bùi Thị Mai Anh

Tiêu đề: Tách biệt các mối liên quan trong xây dựng mô hình dịch tễ học (Separation of concerns in epidemiological modelling)

Trân trọng kính báo và kính mời quý vị quan tâm tham dự.

Tóm tắt

Mô hình hóa và mô phỏng được sử dụng rất nhiều trong dịch tễ học để nghiên cứu các vấn đề liên quan đến truyền nhiễm, các điều kiện để dịch bệnh bùng phát hoặc hiệu quả của các chiến lược phòng ngừa và kiểm soát bệnh tật. Tuy nhiên nhiều nghiên cứu cho thấy các mô hình dịch tễ học rất khó để xây dựng, hoặc một khi đã xây dựng xong thì cũng rất khó để có thể thay đổi (ví dụ thay đổi một số điều kiện để phù hợp với từng vùng, miền nơi dịch bệnh diễn ra…). Thực vậy, một mô hình dịch tễ học thường bao gồm rất nhiều các vấn đề liên quan (concerns). Các mối liên quan đó đều ảnh hưởng đến khả năng bùng phát của dịch bệnh, ví dụ như giống loài, chủng virus, độ tuổi, giới tính, nghề nghiệp,… Những vấn đề này có xu hướng trộn lẫn vào nhau và nằm rải rác trong các mô hình, do đó, rất khó để có thể mô hình hóa chúng một cách riêng biệt.

Mục tiêu đầu tiên của chúng tôi là tìm ra một cách thức cho phép định nghĩa các mối liên quan trong một mô hình dịch tễ học một cách độc lập nhất có thể. Mục tiêu thứ hai là biểu diễn mỗi mô hình như là một tập hợp các mối liên quan liên kết với nhau bởi một toán tử nào đó. Để thực hiện được điều đó, chúng tôi đã đề xuất một phương pháp tiếp cận dựa trên mô hình toán học biểu diễn độ biến động của một quần thể dân số trong đó các cá thể được phân nhóm theo các đặc tính khác nhau (ví dụ biểu hiện bệnh, tuổi, giới tính, tầng lớp xã hội hoặc cư trú địa lý…), gọi là mô hình chia ngăn dân số, compartments-based population model.

Theo đó, mỗi một mối liên quan sẽ được định nghĩa như một automate ngẫu nhiên (stochastic automaton). Mỗi mô hình dịch tễ học sẽ được định nghĩa như một mạng các automate ngẫu nhiên (stochastic automata network), liên kết với nhau bởi toán tử cộng tensor. Mỗi mối liên quan sẽ được định nghĩa một cách độc lập với nhau nhưng các thể hiện (instances) của chúng có thể phụ thuộc lẫn nhau. Điều này cho phép chúng ta có thể định nghĩa mô hình sau đó tùy biến mô hình mà không làm ảnh hưởng đến định nghĩa ban đầu của mô hình.

Để đơn giản hóa việc xây dựng và cài đặt mô hình dịch tễ học, chúng tôi cũng đề xuất ngôn ngữ mô phỏng, Kendrick, cho phép định nghĩa các mối liên quan, liên kết chúng để xây dựng các mô hình dịch tễ và thực hiên các mô phỏng, phân tích cần thiết trong dịch tễ học (ví dụ, mô phỏng độ biến động quần thể, xác định các điều kiện để dịch bệnh xảy ra, phân tích độ nhạy của tham số,…). Về mặt đánh giá, chúng tôi đã so sánh các mô hình dịch tễ (các mô hình được trích dẫn trong các bài báo khoa học đã xuất bản) được định nghĩa bởi Kendrick với cách tiếp cận thông thường sử dụng Matlab (phần lớn các nhà dịch tễ học xây dựng mô hình của mình bằng các ngôn ngữ mô phỏng toán học, Mathematical Modelling Languages, như Matlab, Modelica, Scilab,…). Các kết quả so sánh cho thấy rằng, với Matlab, các mối liên quan trộn lẫn vào nhau và trộn lẫn với các chi tiết cài đặt (ví dụ các khai báo biến, tham số, các hàm tích hợp sẵn trong Matlab…). Ngược lại, với Kendrick, các mối liên quan được định nghĩa một cách độc lập với nhau. Khi cần tùy biến một mô hình, chúng ta không thay đổi định nghĩa của mô hình hay định nghĩa của các mối liên quan chứa trong mô hình mà thay đổi các thể hiện của các mối liên quan (instances of concern) trong mô hình đó.

Modeling and simulation have been heavily used in epidemiology to study the transmission of infectious diseases, their propagation or the effect of control strategies such as vaccination. Unfortunately, epidemiological models are difficult to define and change because they are composed of several concerns that are mixed with each other and scattered in models. Our first objective is to provide means to define those concerns as independently as possible of each other, despite the statistical dependencies between them. Our second objective is to separate model definitions from implementation details. We propose an approach that relies on a mathematical model of the dynamics of a compartment-based population. Concerns are defined, essentially, as stochastic automata and combined using a tensor-sum operator. Statistical dependencies are introduced only in instances of concerns and not in their definitions. A domain-specific language, Kendrick, and tooling support the approach and separate concern definitions, compositions and instantiations from implementation details. To validate our approach we have compared our Kendrick-based approach to a typical MATLAB-based one, on a series of models of avian influenza of increasing complexity. The results of the case study are unambiguous. In the MATLAB approach, concerns are heavily mixed with each other and tangled with low-level implementation details. On the contrary, in our approach, each concern is defined independently of each other, except for a concern that extends another one. On the examples we have considered, our approach has managed to separate and recombine the concerns of compartmental models of epidemiology. More work is needed to apply our approach to more general models in epidemiology and possibly to other domains.

Short Bio:

Dr. Bui Thi Mai Anh had a PhD in Computer Science by University Pierre and Marie Curie (Paris 6, France) in December 2016. Her research interests are software engineering for domain specific languages, modelling and simulations, particularly, agent-based simulation of complex systems.