Yaroslav Kopotilov,塞尔维亚贝尔格莱德的开发商
Yaroslav is available for hire
Hire Yaroslav

Yaroslav Kopotilov

Verified Expert  in Engineering

数据科学家和开发人员

Location
Belgrade, Serbia
至今成员总数
April 9, 2020

Yaroslav是一位具有业务分析经验的全栈数据科学家, 预测建模, 数据可视化, 数据编配, and deployment. 他利用了广泛的机器学习方法, statistics, 以及商业洞察力,为问题找到正确的解决方案. 最重要的是,Yaroslav的目标是交付一个对客户真正有用的项目.

Portfolio

YAFinData
Python, SQL, IT项目管理,IT产品管理,数据分析...
TickUp AB
算法,Python,统计学,交易,金融市场,数据挖掘...
Vitol
ActiveBatch, Kibana, Amazon Athena, Amazon S3 (AWS S3), Git, Oracle SQL, Python...

Experience

Availability

Part-time

首选的环境

Git, Jupyter, PyCharm, Linux, Visual Studio Code (VS Code), SQL, Python

The most amazing...

...我开发的是一种算法交易策略,由多个数据管道和一个全天候运行的ML模型驱动.

Work Experience

创始人|首席开发者

2022 - PRESENT
YAFinData
  • 设计并搭建财务数据与数据分析平台. 数据以统一的方式发送, 用户友好的格式,可以通过web应用程序和REST API访问.
  • 创建了几个24/7 ETL管道,用于收集、清理和上传SQL数据库中的数据. 目前,这些数据覆盖了英国电力市场.
  • 实现从数据馈送实时计算的下游特性. 当收集到新数据时,功能更新大约需要10ms.
  • Developed CI/CD, 备份原始文件存储, 并行冗余, 并配有监控系统,确保数据采集工作24/7顺利进行.
  • 确定了产品开发的总体方向, 设计执行计划, 管理团队成员.
  • 负责数据平台的进一步开发和业务运营的管理.
技术:Python, SQL, IT项目管理,IT产品管理,数据分析, Data Science, Machine Learning, Web Dashboards, Deep Learning, Data Pipelines, Metrics, Dashboards, Team Leadership, Leadership, 技术领导, Finance, Time Series, CTO, PostgreSQL

开发人员|分析师

2020 - 2021
TickUp AB
  • 分析和统一美国股票市场的多个数据集.
  • 开发了机器学习模型和算法交易策略的多个数据管道.
  • 撰写和审查研究笔记和产品代码.
  • 组织了一个为期七天的公司聚会,这有助于提高团队的生产力和协作.
Technologies: 算法,Python,统计学,交易,金融市场,数据挖掘, 算法交易, 时间序列分析, 股市数据, Docker, Jupyter Notebook, 数据可视化, Financial Data, Code Review, SQL, Git, GitHub, Data Analysis, Regression, 统计分析, Data Science, Forecasting, Data Analytics, 回测交易策略, Trade Finance, NumPy, Numba, NVIDIA CUDA, Data Pipelines, Metrics, 定量研究, Finance, Time Series, PostgreSQL

能源交易-数据科学家

2019 - 2020
Vitol
  • 为煤炭、电力和原油部门创建了市场分析工具和系统策略. 涵盖了数据科学项目的所有阶段, 包括项目设置, data pipelines, modeling, and deployment.
  • 分析了不同执行风格对公司整体交易市场的影响.
  • 可以处理小型(50个数据点)和大型(几tb)数据集.
  • 个人贡献,并与数据科学和IT团队合作.
  • 协助Vitol员工进行Python和机器学习培训.
技术:ActiveBatch, Kibana, Amazon Athena, Amazon S3 (AWS S3), Git, Oracle SQL, Python, 时间序列分析, Machine Learning, Data Science, 软件开发, Data Engineering, Jupyter Notebook, Pandas, 算法交易, 数据可视化, Bitbucket, Dashboards, 亚马逊网络服务(AWS), Dash, Web Dashboards, Big Data, Data Analysis, Financial Data, Regression, 统计分析, Forecasting, Data Analytics, 回测交易策略, Trade Finance, NumPy, Data Pipelines, Metrics, Finance, Time Series, Mentorship & 教练,贝叶斯统计,贝叶斯推理 & Modeling

模型验证,商品-助理

2017 - 2018
JPMorgan
  • 从头开始实现自定义版本的扩展卡尔曼滤波器来校准奇异的期权定价模型,该模型优于现有的校准方法.
  • 回顾了十种定价模型的期权及其在商品和信贷领域的应用.
  • 在与桌面和开发人员的协作中度量并减轻了许多模型风险.
  • 指导初级员工进行评审工作.
技术:Python, 衍生品定价, 随机建模, 时间序列分析, Machine Learning, 定量分析, 定量建模, 定量金融学, 定量风险分析, Data Analysis, Financial Data, Forecasting, Data Analytics, 金融建模, NumPy, Reports, 定量研究, Finance, Mentorship & Coaching

算法交易(实习生)

2016 - 2016
Credit Suisse
  • 为商品部门设计并实施了两个中频交易策略.
  • 利用风险因素分析股票部门的投资组合对冲策略.
  • 实现了一个数据管道,用于清理和转换股票工作台的表格数据.
技术:MATLAB, R, SQL, Python, Machine Learning, 时间序列分析, Data Analysis, Financial Data, Regression, 统计分析, Data Science, Forecasting, Data Analytics, 回测交易策略, Trade Finance, NumPy, Data Pipelines, 定量研究, Finance, Time Series

Research (Intern)

2015 - 2015
新西伯利亚国立大学
  • 写了一篇研究论文,描述了一个使用傅里叶描述符来比较形状和内部间隙的度量.
  • 实现了一种分类算法,在包含19类图像的数据集上实现了98%的准确率.
  • 在新西伯利亚举行的科学会议MNSK 2015上发表了研究结果.
技术:OpenCV, Python, Computer Vision, Mathematics, Machine Learning, Jupyter Notebook, Data Analysis, NumPy

互动网站

http://datascienceforhire.net/
这是一个简单的个人网站,由Flask和Dash提供支持. 它在Docker容器中运行,并具有跟踪web活动和错误的监控系统. 虽然我不是网页开发的专家, 创建简单的web界面来可视化数据或机器学习模型预测的能力非常方便.

另一个XML解析器

http://github.com/mysterious-ben/xmlrecords
这是一个简单而高效的解析XML的Python包. 这个包是专门为快速提取表格数据而编写的(与xmltodict不同), 它可以处理任何结构的XML,但速度较慢). XML并不是对数据科学最友好的格式, 因此,将其转换为Pandas或SQL的能力非常方便.

在Kaggle时间序列预测比赛中排名第一

http://www.kaggle.com/myster/eda-prophet-winning-solution-3-0
In 2018, 在我成为数据科学家之前, 我正在学习机器学习的课本,并在各种小项目中测试新学到的方法. 就在那时,我在Kaggle上发现了一个预测商店销售的竞赛. 时间序列是我最喜欢的科目之一,所以我就加入了.
探索和可视化数据集,发现其中有趣的怪癖是非常有趣的. In particular, 很快就清楚了,这些数据是人工合成的, 给出了如何解决这个问题的重要线索. 令人兴奋的是,最后,我的分析得到了回报,我得了第一名!
Also, 我和我的前同事一起做这个项目, 所以这是一次很好的合作经历,只需要一点点项目管理. Of course, 这与管理一个真正的数据科学项目的复杂性相去甚远, 它至少让我预感到前方可能会发生什么.

Python数据管道工具

http://github.com/mysterious-ben/apipe
一个开源Python包,用于基于Dask包创建数据管道. 它的特点是延迟计算和缓存加载, 泡菜和拼花序列化, 并支持NumPy数组和pandas dataframe的哈希.

GPT Telegram Bot

http://t.me/ok_gpt_bot
一个由GPT驱动的电报机器人,具有自定义角色等附加功能. 我作为数据科学家(GPT模型基准测试)做出了贡献, 提示工程, text embeddings), 软件开发人员(异步Python代码, the OpenAI API), project manager, 并指导初级数据科学家.

数据科学示例

http://github.com/mysterious-ben/ds-examples/
探索各种数据科学主题的Jupyter笔记本的集合. 我创建了多个如何应用机器学习的例子, deep learning, experiment design, 高效的数值计算, and visualization. 这是一项正在进行的工作.

Languages

Python, SQL, R, c++, Java, HTML, CSS, XML

Libraries/APIs

Scikit-learn, Pandas, NumPy, Matplotlib, OpenCV, REST APIs, SQLAlchemy, SciPy, Python Asyncio, Dask, PyTorch, TensorFlow, Asyncio

Tools

Jupyter, Git, StatsModels, PyCharm, Amazon Athena, ActiveBatch, MATLAB, Kibana, Plotly, Boto 3, Ansible, GitHub, Bitbucket, Grafana

Paradigms

Data Science, 面向对象编程(OOP), 定量研究, 敏捷软件开发, 功能分析, STOMP

Storage

数据管道,Oracle SQL, PostgreSQL, Amazon S3 (AWS S3), SQLite

Other

预测建模, Forecasting, Data Analysis, 预测分析, Statistics, Machine Learning, 监督式学习, 算法交易, Regression, Data Analytics, 回测交易策略, Time Series, Web Dashboards, 人工智能(AI), 时间序列分析, Mathematics, 数据可视化, 利益相关方参与, Data Engineering, Option Pricing, 无监督学习, Finance, Trading, Financial Data, Dashboards, 定量分析, 定量金融学, 定量风险分析, 统计分析, 金融建模, Numba, 财务软件, OpenAI, Metrics, 贝叶斯统计, 机器学习操作(MLOps), Code Deployment, Algorithms, Futures & Options, Energy, 系统交易, Deep Learning, 概率论, 数学分析, 应用数学, 衍生品定价, Chemistry, 随机建模, 随机微分方程, Econometrics, Economics, Computer Vision, 软件开发, 遗传算法, Dash, Financial Markets, Data Mining, 股市数据, Cloud Services, 远程团队领导, Technical Hiring, Code Review, IT项目管理, Team Leadership, 定量建模, Big Data, APIs, OpenAI GPT-3 API, OpenAI GPT-4 API, Telegram Bots, 自然语言处理(NLP), IT产品管理, Trade Finance, Audio Processing, Numerical Methods, Reports, Applied Physics, 提示工程, Mentorship, Leadership, 技术领导, Mentorship & 训练,贝叶斯推理 & Modeling, CTO

Frameworks

LightGBM, Spark, Flask

Platforms

Jupyter Notebook, Docker, Linux, MacOS, 亚马逊网络服务(AWS), Visual Studio Code (VS Code), NVIDIA CUDA

行业专业知识

项目管理

2015 - 2016

金融数学硕士学位

皮埃尔和玛丽居里大学-巴黎,法国

2012 - 2016

应用数学硕士学位

École巴黎综合理工学院

2012 - 2015

数学和计算机科学硕士学位

新西伯利亚国立大学-俄罗斯新西伯利亚

2008 - 2012

概率与统计学士学位

新西伯利亚国立大学-俄罗斯新西伯利亚

有效的合作

如何使用Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring