ai AI大模型 deepseek FPGA llama 处理器 工具 架构 栈 安谋科技下代“周易”NPU成功部署DeepSeek-R1:速度高达40 tokens/s Daniel 更新时间 2025年2月16日