AI Engineering: Evaluating LLM Performance in Braintrust
Learn how to run evaluation scripts, analyze inputs and outputs, and track AI model performance using the Braintrust dashboard to build reliable AI applications.
Về khóa học này
Building reliable AI applications requires more than just trial-and-error prompting; you must systematically measure and evaluate your model's outputs. This text-based course guides you through the foundational concepts of AI evaluation and teaches you how to track performance metrics effectively. You will transition from guessing if your prompts work to analyzing model runs, comparing inputs and outputs, and leveraging structured evaluation scores to optimize your AI systems.
What you'll learn:
- Understand the fundamental terminology of AI evaluation and LLM performance tracking.
- Configure and run evaluation scripts to generate structured performance scores.
- Analyze inputs, outputs, and system prompts within the Braintrust dashboard.
- Compare different model runs to identify regressions and performance improvements.
- Apply modern evaluation metrics to assess accuracy, latency, and cost.
- Manage test datasets to ensure consistent and reproducible AI benchmarking.
This course begins with core evaluation concepts and foundational definitions before guiding you through running evaluation scripts and interpreting dashboard analytics. It is designed for aspiring AI engineers and developers new to LLM evaluation, requiring no prior experience with Braintrust. Start mastering AI evaluation and build more reliable LLM applications today.
Bạn sẽ nhận được
-
📜
Chứng chỉ hoàn thành
Thêm vào hồ sơ LinkedIn -
💬
Personal AI tutor
Stuck on a lesson? Ask your built-in tutor anything, any time. -
🎧
Bao gồm phiên bản âm thanh
Học mọi lúc mọi nơi — không cần màn hình -
♾️
Truy cập trọn đời
Quay lại bất cứ lúc nào, không hết hạn -
📱
Điện thoại hoặc máy tính
Hoạt động mọi nơi, mọi thiết bị -
💸
Hoàn tiền 30 ngày
Không cần lý do -
⚡
Ngắn gọn, đi vào trọng tâm
1 giờ 56 phút nội dung thực hành
Đánh giá
Chưa có đánh giá — hãy là người đầu tiên chia sẻ.
Học viên cũng học
Nâng cao thực hành giảng dạy của bạn bằng cách thành thạo các công cụ AI tạo sinh để thiết kế giáo án, tạo tài liệu hấp dẫn và cá nhân hóa trải nghiệm học tập của học sinh.
$4.99
Khám phá các nguyên tắc nền tảng của trí tuệ nhân tạo tạo sinh (generative AI) và học cách tạo ra các prompt hiệu quả cho nhiều ứng dụng thực tế.
$4.99
Thiết lập và chạy các mô hình ngôn ngữ mạnh mẽ trên phần cứng của riêng bạn để đảm bảo quyền riêng tư và xây dựng các ứng dụng AI tùy chỉnh mà không phụ thuộc vào đám mây.
$4.99
Tích hợp các mô hình ngôn ngữ tiên tiến vào phần mềm của bạn bằng Python để tự động hóa các tác vụ văn bản, phân tích cảm xúc và xây dựng các tính năng thông minh cho các ứng dụng hiện đại.
$4.99
Câu hỏi thường gặp
Tôi cần gì để học khóa này? +
Chỉ cần điện thoại hoặc máy tính có kết nối internet. Không cần cài đặt hay thiết bị đặc biệt.
Tôi thanh toán bằng cách nào? +
Bằng thẻ qua Stripe, hoặc tiền điện tử. Chúng tôi không lưu thông tin thẻ — Stripe xử lý an toàn.
Tôi có thể được hoàn tiền không? +
Có — hoàn tiền đầy đủ trong 30 ngày, không cần lý do.
Tôi sẽ có quyền truy cập trong bao lâu? +
Mãi mãi. Sau khi mua, khóa học là của bạn để xem lại bất cứ lúc nào.
Tôi có nhận được chứng chỉ không? +
Có. Sau khi hoàn thành, bạn sẽ nhận được chứng chỉ và có thể thêm vào hồ sơ LinkedIn.
Dành cho người học trong
Công nghệ
Thiết kế
Tài chính
Marketing
Y tế
Giáo dục
Khách sạn-Dịch vụ
Sản xuất