构建面向 AI 视觉应用的 E2E 测试框架:集成 Cypress, OpenCV 与 Feature Store 构建面向 AI 视觉应用的 E2E 测试框架:集成 Cypress, OpenCV 与 Feature Store
前端 E2E 测试的核心痛点在于,它只能验证“结构”,无法有效验证“内容”,尤其当内容是由复杂的 AI 模型动态生成时。一个典型的场景:我们的电商应用有一个“智能热区”功能,用户上传一张生活照,AI 模型会识别出图中的商品,并在其上叠加一个
2023-10-27
基于gRPC与LevelDB构建支持GraphQL插件的分布式数据同步网关 基于gRPC与LevelDB构建支持GraphQL插件的分布式数据同步网关
微服务架构下,数据孤岛和服务依赖复杂性是绕不开的难题。不同服务需要从各种外部GraphQL API、SaaS平台或内部老旧系统中获取数据。如果每个服务都直接对接这些数据源,会导致大量的重复开发、不一致的缓存策略和混乱的认证管理。我们面临的正
使用 Packer etcd Caddy 与 Material-UI 构建动态服务网关与控制平面 使用 Packer etcd Caddy 与 Material-UI 构建动态服务网关与控制平面
管理几十个内部微服务的路由配置是一件令人头疼的苦差事。在最初的阶段,我们依赖手动修改 Nginx 配置文件和 nginx -s reload。每次上线一个新服务或下线一个旧实例,都需要运维介入,这个过程不仅效率低下,而且极易出错。证书管理更
2023-10-27
基于TDD与OCI工件实现Flux CD驱动的HBase声明式状态管理 基于TDD与OCI工件实现Flux CD驱动的HBase声明式状态管理
我们团队的 HBase 集群 schema 和 ACL 管理一度陷入混乱。变更流程依赖于工程师手动执行 hbase shell 命令,或是运行一次性的 Groovy 脚本。这种方式在开发环境尚可应付,但在生产环境,它成了事故的温床:权限配置
2023-10-27
使用 ZeroMQ 與 Node.js 構建具備反壓機制的 CQRS 讀模型同步總線 使用 ZeroMQ 與 Node.js 構建具備反壓機制的 CQRS 讀模型同步總線
我們的系統遇到一個典型的瓶頸。寫入負載(Command 側)通過事件通知更新讀取模型(Query 側),一個標準的 CQRS 實現。最初,我們用 ZeroMQ 的 PUB/SUB 模式來廣播領域事件,看中的是它的簡潔和高性能。在開發和低負載
基于 Scikit-learn 和 Prometheus 构建可测试的实时指标异常检测服务 基于 Scikit-learn 和 Prometheus 构建可测试的实时指标异常检测服务
团队维护的 Prometheus 告警规则最近正以惊人的速度膨胀。最初基于静态阈值的规则简单有效,但随着系统复杂性增加,我们开始遇到瓶颈。cpu_usage > 90% 这样的规则无法捕捉到那些多指标之间微妙的、非线性的关联异常。例如
1 / 5