Alex Burlacu
验证专家 in Engineering
机器学习开发人员
多年来, 作为一个经验丰富的机器学习工程师, 亚历克斯处理各种各样的问题, 从计算机视觉到自然语言处理和时间序列预测. 他曾多次作为一名工程师参与这个项目, 尽管缺乏数据和计算资源, 别人失败的地方他成功了. 过去几年,他一直担任机器学习团队的负责人. 在业余时间,Alex喜欢从事独立演讲和ML研究.
Portfolio
Experience
Availability
首选的环境
Ubuntu, Python 3, Visual Studio Code (VS Code), Git, Docker, PyTorch, 神经网络
最神奇的...
...我做的是一个主动学习的多语言BERT模型,用于文档标记,以识别投标属性并加快文档处理速度.
工作经验
软件导致
ClearML
- 领导clearpt项目的实施, 为企业培训和部署自托管llm的一组无代码工具. 我在不同阶段积极塑造项目的设计和路线图(MVP), Demo, 和客户PoC).
- 在AWS G5实例上调整和部署多个基于llama和FLAN-T5的模型,以获得最佳性价比. 也与多gpu和多节点训练使用HuggingFace加速.
- 构建工具来生成Q&来自文档页面的数据集, 一个支持rag的数据集生成管道, 还有一个定制的训练器,它会对表现最差的样本进行过度采样,以迫使模型更多地关注于提高难样本的表现.
- 领导ClearML SDK团队,负责开发特性并确保包的开源和企业版本的及时发布. 我积极参与未来版本特性的优先级排序和计划.
- 参与社区和企业支持活动. 进行技术培训,并积极建议客户如何最好地利用ClearML和clearpt, 考虑到它们独特的约束和要求.
机器学习团队负责人
DevelopmentAid
- 在文档上使用机器学习(ML)和深度学习进行自然语言处理(NLP),使数据输入更高效.
- 开发和生成多个ML微服务, 包括使用PyTorch和BERT通过命名实体识别对文档进行分类和标记, 另一个是利用scikit-learn处理不平衡的多输出文本分类.
- 定义并编写了用于命名实体识别(NER)的快速数据注释和合成数据充实的程序. 将数据集大小从少量注释良好的文档增加到100多个.
- 指导新机器学习模型的开发和实现实践,如机器学习代码审查, 交叉验证, 以及可复制的实验.
- 定义了一些MLOps实践,主要与使用Ray Serve的模型服务和使用MLflow的实验跟踪有关.
- 建立可观察的基础设施,以减少未报告错误的数量,并将bug发现时间从几天缩短到大约10分钟. 使用机甲和ELK,帮助收养普罗米修斯和格拉凡纳.
- 定义并记录部署过程,并将部署训练模型的时间减少到10分钟以内. 管理一个Jenkins实例,并使用Jenkins管道.
- 已建立的代码审查, 定期一对一会议, 明确的编码最佳实践, 以及像迭代计划这样的敏捷过程, 规划扑克, 站立会议, 将功能周期时间减少5倍,每次迭代的新bug减少到0.3.
- 自2020年7月起,领导由三名初级工程师组成的团队开发自动数据输入解决方案, 开发和部署新的ML模型, 处理我们的可观察性和CI基础设施.
研究实习生
巴黎北部索邦大学
- 提高了深度学习算法的样本效率, 混合技术从自我监督, semi-supervised, 并且少镜头学习适用于图像和其他数据源.
- 使用谷歌Colab笔记本电脑进行实验,然后切换到谷歌云平台. 配备了Terraform和Ansible, 使用一个bash命令在一到两分钟内创建图形处理单元(GPU)工作器和跟踪服务器.
- 采用MLFlow进行实验跟踪,结合Papermill和Optuna进行超参数优化.
大学助理
摩尔多瓦技术大学
- 重新创建并教授网络编程课程和两个专注于并发原语和网络协议的实验项目.
- 撰写并讲授实时编程课程和三个涉及基于消息的并发性的实验项目, 包括演员模型和CSP, 以及面向消息的集成模式和协议,如MQTT和XMPP.
- 全面检查和领导分布式系统和网络编程课程和实验室. 更新实时编程课程并讲授.
- 涵盖了分布式系统课程中的各种主题, 比如数据处理系统, 分布式数据库, 微服务设计模式, 以及分布式系统的主要问题, 就像共识一样, time, 而且只送一次.
- Mentored five final-year students for their semester project; two of them chose me as their bachelor thesis supervisor. 每学期领导40多名学生的实验室.
暑期实习生
Cern
- 作为副合伙人参与EP-SFT小组, 获得英国科学技术设施委员会(STFC)的资助.
- 开发了一个项目,针对针对高能物理(HEP)的多层感知器,对TMVA包针对TensorFlow的逐事件推理性能进行基准测试。.
- 搜索ROOT科学包的TMVA子包的瓶颈和未来优化方向.
- 得出的结论是,, for one-by-one and small batch (< 32) inference modes, TMVA比TensorFlow 1快两个数量级.8、使用c++推理API从启用AVX512的源代码构建.
- 在布加勒斯特EEML 2019暑期学校的一次会议上展示了关于这项工作的海报.
机器学习工程师
氧化还原娱乐
- 研究开发用于体外受精卵母细胞医学图像分析的神经网络. 使用自动编码器预训练和自监督学习的连体网络等技术,创建了十多个定制的神经网络架构.
- 指导并培养了一位博士.D. 实习三个月后成为团队一员,也参与深度学习相关项目.
- 为小型企业开发了专门的体系结构, 低方差医学图像数据集,其性能与谷歌的AutoML Vision相当.
- 调试了一个预处理数据问题,泄漏了测试集,错误地在评估过程中给出了非常高的准确性. 防止发布损坏的模型,从而挽救了公司的声誉.
联合创始人兼首席技术官
BookVoyager
- 开发基于搜索和内容的小说推荐系统,从原始文本中提取特征,并根据这些特征提供推荐.
- 实现日志记录,以便更快地进行故障排除,并将体系结构定义为多服务系统.
- 利用SpaCy构建了基于令牌级和全文分析的特征提取和推荐子系统.
- 参与客户访谈, 定义了业务和开发过程, 并在不同的场所推销这个项目.
- 通过使用预分配数组将推荐结果的计算速度提高85倍,并使用性能分析来识别瓶颈.
Experience
Serverless平台
以丰富其功能, 我添加了一些其他服务,比如RabbitMQ, Minio, PostgresSQL, MongoDB, 和Apache Tika. 让它更容易使用, 我编写了一个类似API网关的服务, TCP服务器将HTTP请求转换为消息,并将响应作为HTTP响应发送回调用方.
这个项目后来成为一门独立讲授的分布式系统设计课程的基础. 这是一门免费课程,有25名学生参加,其中11人获得结业证书.
亚历克斯的偶尔博客文章|个人博客
http://alexandruburlacu.github.io我用杰基尔创造了它, 自定义一些模板, 并增加了谷歌分析和谷歌标签管理器.
用于人工智能研究的轻量级MLOps模板
摩尔多瓦国家Python和人工智能课程
http://mecc.gov.md/sites/default/files/curriculum_ia_aprobat_cnc.pdfSkills
Languages
Python 3, Python, Elixir, Bash, SQL, c++, C, Python 2, Lisp, HTML, CSS, Java 8, Erlang, Scala
库/ api
Scikit-learn, REST api, PyTorch, TensorFlow, 詹金斯管道, Pandas, Keras, Vue, OpenCV, SpaCy
Tools
Git, 码头工人组成, RabbitMQ, Jekyll, 谷歌分析, Jenkins, Grafana, Scikit-image, Terraform, Ansible, Bazel, Helm, BigQuery, AWS CLI
Paradigms
REST,数据科学,函数式编程,DevOps,单元测试,面向对象分析 & Design (OOAD), 面向对象编程(OOP), 敏捷软件开发, Serverless架构, 并行编程, Actor Model, Microservices, 设计模式
Platforms
Docker, Ubuntu, Kubernetes, Jupyter笔记本, 谷歌云平台(GCP), Visual Studio Code (VS Code), Amazon EC2
Other
深度学习, 机器学习, 机器学习操作(MLOps), 自然语言处理(NLP), 人工智能(AI), 神经网络, GPT, 生成预训练变压器(GPT), Fine-tuning, 语言模型, 大学教学, 团队指导, FastAPI, Self-supervised学习, Learning, 计算机视觉, 团队的领导, Hugging Face, BERT, 图形处理器(GPU), 生成式人工智能(GenAI), 提示工程, 分布式系统, 云计算, MinIO, Serverless, TCP, HTTP, Coding, HATEOAS, Ray, Jaeger, Prometheus, Transformers, MLflow, 医学成像, Few-shot学习, Hyperparameter优化, Optuna, ROOT, HTTP 2, 消息队列, Mentorship, 图像处理, 情绪分析, Kustomize, 工程数据, ClearML, Multi-GPU培训, 大型语言模型(llm), LLaMA, Flan-T5, 问题一代, Q&机器人,检索增强生成(RAG), OpenAI GPT-3 API,调试,研究,数据综合
Frameworks
Flask
Storage
JSON, Google Cloud, MongoDB, XML-RPC, PostgreSQL, Amazon S3 (AWS S3)
Education
计算机科学硕士学位
斯特凡塞尔马雷大学- Suceava,罗马尼亚
计算机科学硕士学位
摩尔多瓦技术大学基希讷乌,摩尔多瓦
计算机科学学士学位
摩尔多瓦技术大学基希讷乌,摩尔多瓦
认证
谷歌云认证专业机器学习工程师
Google Cloud
谷歌云认证专业云架构师
Google Cloud
认证Kubernetes应用开发人员(CKAD)
云原生计算基金会(CNCF)
深度学习工程师
Workera
如何使用Toptal
在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.
分享你的需求
选择你的才能
开始你的无风险人才试验
对顶尖人才的需求很大.
Start hiring