Trang chủ » Học AI » Thuật ngữ AI » Triển khai API với FastAPI, Uvicorn và Docker

Triển khai API với FastAPI, Uvicorn và Docker

10/12/2025 207 4.8/5 trong 5 lượt

Trong thời đại công nghệ, việc triển khai một API nhanh chóng và hiệu quả là điều cần thiết. Bài viết này sẽ hướng dẫn bạn cách sử dụng FastAPI kết hợp với Uvicorn và Docker để đóng gói và triển khai mô hình NLP. Chúng tôi sẽ đi qua từng bước từ đóng gói, tạo endpoints, viết tests, đến dockerize và giám sát triển khai.

Đóng gói mô hình

Trước khi có thể triển khai bất kỳ mô hình học máy nào, bước đầu tiên là đóng gói nó. Việc đóng gói không chỉ đơn thuần là lưu trữ mô hình mà còn đảm bảo rằng tất cả các phụ thuộc cần thiết cũng đi kèm, giúp cho việc triển khai mô hình trên các môi trường khác nhau trở nên dễ dàng và nhất quán. Trong phần này, chúng ta sẽ tìm hiểu cách sử dụng Docker để đóng gói mô hình học máy một cách hiệu quả và tái tạo dễ dàng trên nhiều hệ thống khác nhau.

Docker là một công cụ tuyệt vời khi bạn muốn tạo một môi trường cô lập để chạy ứng dụng hoặc mô hình. Với Docker, bạn có thể tạo ra một container bao gồm tất cả mọi thứ mà mô hình của bạn cần để hoạt động, từ mã nguồn mô hình cho đến các thư viện phụ thuộc. Container này có thể được chuyển giao giữa các máy khác nhau mà không cần lo lắng về việc thiết lập môi trường lại từ đầu.

Để bắt đầu, bạn cần phải viết một Dockerfile, đây là tập tin hướng dẫn Docker làm thế nào để xây dựng container của bạn. Dockerfile chính là nơi bạn định nghĩa cơ sở (base image) cho môi trường của mình, cài đặt các phần mềm cần thiết, và chèn mã nguồn của mô hình.

Ví dụ, nếu mô hình của bạn được viết bằng Python, bạn có thể bắt đầu với một base image Python như sau:

FROM python:3.8-slim

WORKDIR /app

COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

COPY . .

CMD ["python", "app.py"]

Trong Dockerfile trên, python:3.8-slim là base image cho phép bạn bắt đầu với một hệ thống Python nhẹ. Bạn thay đổi thư mục làm việc đến `/app`, sau đó sao chép file requirements.txt vào container và cài đặt các thư viện cần thiết. Cuối cùng, mã nguồn của bạn cũng được sao chép vào container và thiết lập để chạy với lệnh CMD.

Thao tác COPY trong Dockerfile cho phép bạn đưa mã nguồn và các tài nguyên cần thiết từ máy tính của bạn vào trong container. Một điều quan trọng cần lưu ý là hãy chắc chắn chỉ sao chép những file và thư mục cần thiết để giữ cho container nhẹ nhất có thể.

Khi Dockerfile của bạn đã sẵn sàng, bạn có thể xây dựng container với lệnh sau:

docker build -t mymodel:latest .

Lệnh này sẽ tạo một image Docker với tên mymodel và tag latest. Một khi image đã được tạo, bạn có thể chạy container từ image này để kiểm tra xem mô hình của mình hoạt động đúng cách chưa, hoặc thậm chí đẩy image lên một registry công cộng để dễ dàng chia sẻ và triển khai.

Với Docker, việc đảm bảo mô hình của bạn hoạt động một cách độc lập và có thể tái tạo trên các môi trường khác nhau trở nên đơn giản hơn bao giờ hết. Khi đóng gói mô hình và các phụ thuộc trong Docker container, bạn không cần phải lo lắng về sự không tương thích giữa các môi trường hoặc việc thiếu tập tin hệ thống, điều này giúp tập trung hoàn toàn vào việc tối ưu hóa và triển khai mô hình của bạn.

Việc đóng gói mô hình chỉ là bước đầu tiên trong quy trình triển khai API hiệu quả. Sau khi đã hoàn tất bước này, việc tạo các điểm cuối HTTP để mô hình có thể giao tiếp với thế giới bên ngoài thông qua FastAPI là rất cần thiết. Hãy tiếp tục với chương sau đây để tìm hiểu cách thiết lập và triển khai nhanh chóng các endpoint với FastAPI.

Tạo endpoints với FastAPI

FastAPI là một công cụ mạnh mẽ cho việc tạo các điểm cuối HTTP ("endpoints") trong ứng dụng của bạn. Điểm mạnh của FastAPI nằm ở khả năng xử lý nhanh chóng, dễ sử dụng và cung cấp tài liệu API tự động. Trong phần này, chúng ta sẽ xem xét cách thiết lập một môi trường FastAPI và cách sử dụng nó để tạo các endpoint phục vụ cho mô hình NLP mà bạn đã đóng gói trong bước trước.

Bạn đã biết rằng mô hình của bạn cần phải hoạt động một cách độc lập trong container Docker. Bây giờ, để có thể giao tiếp với mô hình từ bên ngoài, bạn cần thiết lập một giao diện HTTP thông qua các điểm cuối FastAPI.

Thiết lập môi trường FastAPI

Bước đầu tiên để làm việc với FastAPI là thiết lập môi trường Python của bạn. Bạn có thể bắt đầu bằng cách tạo một môi trường ảo và cài đặt các phụ thuộc cần thiết. Chạy các lệnh sau trong terminal của bạn:

python3 -m venv env
source env/bin/activate
pip install fastapi uvicorn

Chúng ta sử dụng Uvicorn làm ASGI server để chạy ứng dụng FastAPI. Sau khi cài đặt xong, bạn có thể bắt đầu xây dựng ứng dụng FastAPI của riêng mình.

Tạo và định tuyến các endpoint

Với FastAPI, bạn có thể dễ dàng tạo các endpoint cho ứng dụng của mình. Dưới đây là ví dụ đơn giản về cách bạn có thể tạo một endpoint cho mô hình của bạn:

from fastapi import FastAPI
app = FastAPI()

@app.post("/predict")
async def predict(data: YourDataModel):
# Gọi hàm dự đoán từ mô hình của bạn
result = your_model.predict(data.inputs)
return {"prediction": result}

Trong đoạn mã này, chúng ta đã tạo một endpoint POST tại đường dẫn /predict. Khi nhận được một yêu cầu POST, endpoint sẽ gọi hàm dự đoán từ mô hình của bạn và trả về kết quả dự đoán dưới dạng JSON.

Định nghĩa các mô hình dữ liệu

Để xác định cấu trúc dữ liệu của yêu cầu và phản hồi, FastAPI sử dụng Pydantic để xác định các mô hình dữ liệu. Điều này giúp đảm bảo dữ liệu đầu vào được xác định rõ ràng và sai sót do nhập liệu không được chấp nhận. Dưới đây là cách sử dụng Pydantic để định nghĩa một mô hình dữ liệu:

from pydantic import BaseModel

class YourDataModel(BaseModel):
inputs: List[float]

Ở đây, chúng ta đã định nghĩa một lớp YourDataModel thừa kế từ BaseModel, có thuộc tính inputs là một danh sách chứa kiểu số dấu chấm động.

Tài liệu API - OpenAPI

FastAPI tự động tạo tài liệu cho API của bạn theo định dạng OpenAPI, điều này rất hữu ích cho việc kiểm tra và phát triển. Bạn có thể truy cập tài liệu này bằng cách mở trình duyệt và truy cập /docs hoặc /redoc:

uvicorn main:app --reload

Sau khi chạy lệnh trên, hãy mở một trình duyệt web và truy cập http://127.0.0.1:8000/docs để xem tài liệu API tự động của bạn. Nó không chỉ giúp bạn kiểm tra API mà còn rất có ích cho việc giao tiếp với các nhà phát triển khác hoặc khách hàng của bạn.

Như vậy, bạn đã có các kiến thức cơ bản về cách sử dụng FastAPI để tạo các endpoint cho mô hình của bạn. Trong bước tiếp theo, chúng ta sẽ tìm hiểu cách viết và chạy các bài test cho API này để đảm bảo hoạt động đúng và ổn định.

Viết tests cho API

Testing là một phần quan trọng và không thể thiếu trong quy trình phát triển phần mềm, đặc biệt khi phát triển API. Đảm bảo rằng API của bạn hoạt động chính xác và ổn định giúp tăng cường độ tin cậy và hiệu suất của hệ thống. Trong ngữ cảnh FastAPI, việc viết và chạy các bài test trở nên thuận tiện nhờ vào Pytest, một trong những framework test phổ biến nhất cho Python.

Trước khi bước vào các bước cụ thể, hãy chắc chắn rằng bạn đã cài đặt pytest trong môi trường làm việc của mình. Bạn có thể cài đặt nó thông qua pip:

pip install pytest

Sau khi Pytest đã được thiết lập, chúng ta sẽ bắt đầu bằng cách viết các bài test cơ bản cho API. Đầu tiên, chúng ta tạo một file mới có tên là test_api.py. Đây sẽ là nơi lưu trữ tất cả các bài test của chúng ta.

Để test các endpoint trong FastAPI, chúng ta cần sử dụng TestClient từ package fastapi.testclient. Đây là bước khởi đầu:


from fastapi.testclient import TestClient
from your_api_file import app

client = TestClient(app)

Với client được khởi tạo từ TestClient, chúng ta có thể bắt đầu viết các phương thức test. Ví dụ, để kiểm tra các endpoint GET và POST, chúng ta có thể viết như sau:


def test_read_main():
    response = client.get("/")
    assert response.status_code == 200
    assert response.json() == {"msg": "Hello World"}

def test_create_item():
    response = client.post("/items/", json={"name": "Foo"})
    assert response.status_code == 200
    assert response.json() == {"name": "Foo"}

Bên cạnh việc kiểm tra các endpoint, cần đảm bảo rằng API của bạn cũng cần có khả năng xử lý các đầu vào không hợp lệ một cách chính xác. Để kiểm tra điều này, bạn có thể tạo một bài test cho các tình huống lỗi:


def test_invalid_input():
    response = client.post("/items/", json={"invalid_field": "Foo"})
    assert response.status_code == 422

Khả năng phục hồi sau lỗi cũng là yếu tố quan trọng mà bạn cần test trong API. Một cách tiếp cận hiệu quả là sử dụng các giả lập lỗi (mock) để đảm bảo rằng API của bạn xử lý lỗi một cách trang nhã và không gây tác động tiêu cực lên trải nghiệm người dùng. Với Pytest, bạn có thể sử dụng plugin pytest-mock để tạo mock cho các đối tượng hoặc phần của mã nguồn:


from unittest.mock import patch
from your_api_file import some_function

def test_some_function_error_handling():
    with patch('your_api_file.some_function', side_effect=Exception("Test Exception")):
        response = client.get("/some-endpoint/")
        assert response.status_code == 500

Khi bạn đã hoàn tất việc tạo các bài test, chúng có thể được chạy đơn giản bằng lệnh pytest tại thư mục chứa các file test. Pytest sẽ tự động phát hiện các file và hàm test để thực thi.

Việc thực hiện test định kỳ cho API của bạn không chỉ giúp phát hiện và khắc phục lỗi sớm, mà còn đảm bảo rằng các cải tiến hay thay đổi mới không gây ra các vấn đề không mong muốn. Điều này đặc biệt quan trọng khi triển khai mô hình NLP qua FastAPI và Docker, vì sự ổn định và hiệu suất là các yếu tố then chốt.

Dockerize ứng dụng

Sau khi API của bạn đã hoàn tất các bài kiểm thử và đảm bảo hoạt động đúng cách, bước tiếp theo trong quy trình phát triển là đóng gói ứng dụng bằng Docker. Docker là một công cụ mạnh mẽ cho phép bạn đơn giản hóa việc triển khai ứng dụng bằng cách đóng gói tất cả các phần phụ thuộc cần thiết vào một container duy nhất. Quá trình này giúp bảo vệ ứng dụng khỏi các vấn đề liên quan đến môi trường và đảm bảo rằng mọi thứ hoạt động như mong đợi khi triển khai trên môi trường thực tế.

Để bắt đầu, chúng ta cần tạo một file Dockerfile, đây là nơi mà chúng ta định nghĩa cách thức xây dựng image cho ứng dụng của mình. Một Dockerfile hiệu quả sẽ đảm bảo rằng ứng dụng chạy mượt mà và sử dụng tài nguyên một cách tối ưu. Trong trường hợp của chúng ta, nội dung trong Dockerfile sẽ bao gồm việc cài đặt các thư viện cần thiết cho FastAPI, mô hình NLP, cũng như mọi package bổ sung mà bạn đã sử dụng trong quá trình phát triển.

Sử dụng Python Base Image

Khi lập bản Dockerfile, hãy chọn một Python base image phù hợp với phiên bản Python mà bạn đã sử dụng trong quá trình phát triển. Ví dụ, bạn có thể bắt đầu với:

FROM python:3.8-slim

Phiên bản 'slim' thường được ưa chuộng vì nó nhẹ và phù hợp để giảm kích thước tổng thể của image.

Thiết lập môi trường làm việc

Tạo một thư mục làm việc trong container và sao chép các file dự án vào thư mục này:

WORKDIR /app
COPY . /app

Thiết lập này đảm bảo các file dự án được tổ chức hợp lý trong container.

Cài đặt các phụ thuộc

Tiếp theo, cài đặt các thư viện và phụ thuộc cần thiết bằng cách tham chiếu tới file requirements.txt đã có sẵn:

RUN pip install --no-cache-dir -r requirements.txt

Đoạn lệnh này đảm bảo rằng tất cả các gói cần thiết cho ứng dụng được cài đặt kèm theo mà không lưu cache, giúp giảm kích thước image.

Chạy ứng dụng với Uvicorn

Sau khi các phụ thuộc đã được cài đặt, bạn có thể cấu hình Docker để chạy API bằng Uvicorn. Điều này được thực hiện bằng cách sử dụng câu lệnh CMD hoặc ENTRYPOINT:

CMD ["uvicorn", "app.main:app", "--host", "0.0.0.0", "--port", "8000"]

Câu lệnh trên thiết lập Uvicorn để chạy ứng dụng FastAPI và lắng nghe trên cổng 8000.

Tối ưu hóa Dockerfile

Khi viết Dockerfile, có một số thực tiễn tốt nhất cần lưu ý để tạo ra một image hiệu suất cao:

Sử dụng .dockerignore: Loại bỏ các file không cần thiết khỏi build context để giảm kích thước image.
Kết hợp các câu lệnh RUN: Giảm số lượng layer trong image bằng cách kết hợp nhiều lệnh cài đặt vào một.
Sử dụng cache hiệu quả: Sắp xếp lại các dòng lệnh để tăng khả năng sử dụng lại cache, đặc biệt là đối với các lệnh ít thay đổi như cài đặt phụ thuộc.

Những thực tiễn này không chỉ giúp tạo ra image gọn gàng hơn mà còn giúp tăng tốc quá trình build và triển khai.

Triển khai và giám sát

Sau khi hoàn chỉnh mọi thứ và Dockerize ứng dụng thành công, bước tiếp theo là triển khai API này lên môi trường sản xuất. Ở giai đoạn này, việc sử dụng Docker Compose trở nên vô cùng hữu ích, cho phép bạn quản lý nhiều container một cách dễ dàng và đảm bảo chúng tương tác với nhau một cách mượt mà.

Docker Compose là một công cụ mạnh mẽ giúp đồng bộ hóa và tích hợp các dịch vụ khác nhau mà ứng dụng của bạn cần. Thay vì phải khởi chạy từng Docker container một cách thủ công, bạn có thể sử dụng một tệp docker-compose.yml để định nghĩa và quản lý tất cả các container cần thiết chỉ với một dòng lệnh duy nhất docker-compose up.

Giám sát ứng dụng sau triển khai là một yếu tố không thể thiếu để đảm bảo dịch vụ hoạt động ổn định và hiệu quả. Có nhiều công cụ giám sát mà bạn có thể lựa chọn, mỗi công cụ có những đặc điểm và ưu thế riêng thích hợp cho các nhu cầu giám sát khác nhau.

Trước khi lựa chọn công cụ giám sát, bạn nên xác định rõ các yếu tố nào của dịch vụ cần được giám sát. Những yếu tố này thường bao gồm:

Sự sẵn sàng và phản hồi của API.
Hiệu năng và thời gian phản hồi của các endpoints API.
Tình trạng tài nguyên của server, bao gồm CPU, RAM, và lưu lượng băng thông mạng.

Các công cụ giám sát phổ biến bao gồm:

Prometheus và Grafana

Prometheus là một hệ thống giám sát và cảnh báo mã nguồn mở nổi tiếng, chuyên dùng để thu thập và tổng hợp số liệu dữ liệu thời gian thực. Kết hợp với Grafana, một công cụ hiển thị dữ liệu mạnh mẽ, bạn có thể tạo ra những bảng điều khiển thân thiện và dễ hiểu về các số liệu giám sát. Điều này giúp bạn theo dõi tình trạng hệ thống một cách trực quan và phát hiện kịp thời các vấn đề xảy ra.

ELK Stack

Bộ ELK gồm Elasticsearch, Logstash, và Kibana, cho phép các nhà phát triển ghi lại các log và phân tích chúng để phát hiện và giải quyết các vấn đề hệ thống. Elasticsearch chịu trách nhiệm lưu trữ và tìm kiếm dữ liệu log, Logstash thu thập và xử lý log từ nhiều nguồn, trong khi Kibana hỗ trợ tạo ra các trang tổng quan giúp phân tích và giám sát dữ liệu qua giao diện đồ họa.

Một phương pháp giám sát hiệu quả không chỉ dừng lại ở việc sử dụng một công cụ duy nhất, mà cần sự kết hợp nhiều công cụ khác nhau để khai thác tối đa thông tin và giám sát toàn diện mọi khía cạnh của hệ thống.

Cuối cùng, việc triển khai một API với FastAPI, Uvicorn, và Docker có thể phức tạp nhưng sẽ trở nên dễ dàng và thuận lợi hơn khi bạn biết cách tổ chức và giám sát. Đảm bảo bạn đã thử nghiệm đầy đủ trước khi đưa API vào môi trường thực tế, và không ngừng giám sát để đảm bảo tính ổn định cũng như hiệu suất của dịch vụ.

Bạn đọc có thể theo dõi thêm các bài viết chi tiết khác tại blog nha.ai.vn để tìm hiểu thêm về cách sử dụng công nghệ tối ưu hóa các dịch vụ của mình.

Kết luận
Triển khai một API nhanh chóng và hiệu quả là một kỹ năng cần thiết trong phát triển phần mềm hiện đại. Bằng việc sử dụng FastAPI, Uvicorn và Docker, bạn có thể xây dựng và quản lý các dịch vụ API một cách linh hoạt và đáng tin cậy. Thông qua các bước đóng gói, phát triển endpoint, test, dockerization và triển khai, bạn có thể đảm bảo API của mình luôn luôn đạt hiệu suất cao và dễ bảo trì.

By AI

FastAPI, Uvicorn, Docker, triển khai phần mềm, đóng gói API, NLP

Bản in Quay lại