研究工程作品集

证明、基准与系统,让证据靠近每一个 claim。

我是华盛顿大学数学本科生。我构建面向证明的软件、可复现的基准测试框架、证书形状的运行时工具和数据系统,让公开写出来的结论能回到源码、运行记录和 artifact 里检查。

关于

我把数学想法落成可以检查的软件。

我最强的项目通常位于证明、算法设计和实际工程之间。我会认真处理精确输入格式、失败路径、可复现命令,以及哪些内容已经验证、哪些还不能声称完成。

当前工作包括 Lean 4 形式化、Euclidean domain 与类似 PID 结构上的 normal forms、稀疏矩阵基准、面向证书的运行时监控,以及假设需要保持可见的数据流程。

Lean 4 / mathlib Rust Python C++ 形式化验证 HPC 基准测试 算法设计 可复现性

精选项目

六个带可追溯证据路径的项目。

每张项目卡都说明现有内容是什么,它证明或测量了什么,以及当前 claim 的边界在哪里。

模型评估流水线

FlashDistill

一个 Python/uv 的 pre-Hyak 本地数据工厂,用于数学 distillation 实验。它把生成、normalization、verification、SFT packing、cost log、report 和 data manifest 放进同一个 CLI 流程里。

这个仓库停在可复现的本地 gate 和 Hyak handoff runbook:会产出 JSONL artifact 与 manifest hash,但不声称已经提交或运行 GPU training jobs。

Python uv LLM evals Schemas
本地 artifact / 公开发布待补

公共议题数据分析

Seattle Transit Restoration

一个用于 Seattle transit restoration 的 Python 分析仓库,重点是 schedule-based 数据:King County Metro 官方 GTFS、Transitland 历史 GTFS、NOAA 天气数据和 ACS demographics。

这里的 optimization claim 应理解为 static-data connectivity analysis:routing modules、candidate generation 和 MIP optimization。 GTFS-RT scripts 存在,但不是这里 restoration 结果的依据。

Python Data analysis Civic tech
打开 GitHub

图像工具

agentic-color

一个 FastAPI + React/Vite 的图像调色 MVP。后端接收上传图片,返回 schema-backed ImageAnalysis,其中包含三个 StyleVariant presets。

它有价值的部分是可编辑性:每个 variant 都保留明确的 tone/color 参数和预览卡片。当前 analyzer 仍是 MVP/mock variants,所以不会写成 production ML grader。

Python Computer vision Image editing
打开 GitHub

IoT 案例研究

All-in-One 空气质量检测仪

一个用于观察室内空气质量的小硬件项目:ESP32-C3、SEN55、板载 OLED、ESPHome 固件,以及接入 Home Assistant 的 PM、温湿度、VOC 和 NOx 趋势数据。

这篇 case study 记录 parts list、wiring table、firmware YAML、display 行为,以及最终定位到真实 I2C pins 的黑屏排查路径。

ESP32 ESPHome Sensors
阅读案例研究