Viktor Petukhov,格鲁吉亚第比利斯的开发商
Viktor is available for hire
Hire Viktor

Viktor Petukhov

Verified Expert  in Engineering

Data Scientist and AI Developer

Location
Tbilisi, Georgia
Toptal Member Since
September 22, 2022

维克多拥有生物统计学博士学位, 在此期间,他开发了八个开源软件包,被全球数千名研究人员使用. 他还担任过数据科学团队负责人和独立人工智能顾问, 将业务需求转化为技术术语. 结合科学与企业经验, 维克多可以全方位地支持公司, 从制定业务问题到构建生产就绪的人工智能解决方案.

Portfolio

Tentakel
管理、战略、融资、人工智能(AI)...
Self-employed
策略,计算机视觉,机器学习,数据抓取,数据分析...
CleverBots
Python,管理,人工智能,Linux, Jupyter, Git...

Experience

Availability

Part-time

Preferred Environment

Linux, Jupyter, RStudio, Git, Visual Studio Code (VS Code), PyCharm, CLion

The most amazing...

...我开发的项目是对基于成像的转录组学数据进行无监督分割的管道, 活跃于该领域前五名的实验室.

Work Experience

CTO

2023 - PRESENT
Tentakel
  • 为将自然语言查询转换为SQL和数据可视化的服务开发了一个产品的MVP.
  • 为包含千兆字节文档的检索增强生成(RAG)管道开发了一个工作产品.
  • 雇佣并管理了一个由三名软件开发人员组成的团队.
Technologies: 管理、战略、融资、人工智能(AI), 自然语言处理(NLP)

Data Science Consultant

2021 - PRESENT
Self-employed
  • 提出了一种高架桥货车故障可解释检测算法.ai.
  • 制定了在一家无人机生产初创公司成立计算机视觉部门的策略. 它帮助吸引了30万美元的资金,这个部门成功地成立了.
  • 分析了数千份替代蛋白质行业的招聘广告, 哪些显著改善了人力资源机构的业务策略.
Technologies: 策略,计算机视觉,机器学习,数据抓取,数据分析, Business Cases, GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), Linux, Jupyter, Git, Data Visualization, Artificial Intelligence (AI), Python, Computational Biology, Data Science, Natural Language Toolkit (NLTK), SQL, REST APIs, PyTorch, Deep Learning, Language Models, Data Extraction, Data Manipulation, Data Analytics, Large Data Sets

Data Science Team Lead

2018 - 2019
CleverBots
  • 开发了一种匹配算法,用于网络和活动推荐,部署在一个为期一周的教育活动主办超过1,000 participants.
  • 构建市场份额预测算法,准确率达到95%以上.
  • 管理在线教育平台流失率预测项目的开发人员.
Technologies: Python,管理,人工智能,Linux, Jupyter, Git, Bayesian Statistics, Data Visualization, Data Analysis, Data Science, Natural Language Toolkit (NLTK), PyTorch, Deep Learning, Data Extraction, Data Manipulation, Data Analytics

Algorithm Developer

2015 - 2017
EPAM Systems
  • 实现了一种基于光学图谱测序的DNA结构变异搜索算法.
  • 重新实现药物效应趋势分析算法, 将其移植到一个新的实验管理系统中.
  • 扩展了剂量-响应曲线拟合算法,增加了额外的曲线参数.
Technologies: Perl, Python, C++, Java, SAS, R, Algorithms, Linear Algebra, Statistics, Linux, Jupyter, RStudio, Git, Bayesian Statistics, Computational Biology, Data Analysis, Bioinformatics, Data Science, SQL, REST APIs, Data Manipulation, Data Analytics

基于图像的空间转录组学数据贝叶斯分割

http://github.com/kharchenkolab/Baysor
基于图像的空间转录组学数据的无监督分割工具. 它是作为对新的数据生成协议的响应而开发的,这些协议没有好的方法来分析生成的数据. Baysor是目前唯一可以在不进行额外生物实验的情况下理解这些空间数据的工具. 它被用于世界各地的许多实验室, 包括那些开创了基于成像的转录组学领域的人.

dropEst:用于scRNA-seq数据低级处理的管道

http://github.com/kharchenkolab/dropEst
用于单细胞rna测序数据低级处理的高性能工具. 该管道由两部分组成:

•第一部分执行数据提取和转换从原始测序数据到适合数据分析的格式(基因表达矩阵).
•第二部分使用字符串算法纠正排序错误并过滤数据中的噪声, Bayesian statistics, and machine learning techniques.

一个改进数据可视化的R包

http://cran.r-project.org/web/packages/ggrastr/index.html
ggrastr is a ggplot2 extension, 它允许栅格化的个别层的绘图科学可视化. 第一版于2017年发布, 目前,科学界仍在积极使用这一包装, with around 5,000 downloads per month. 它最初是由我一个人开发和宣传的, though after gaining popularity, 该方案在很大程度上是由其他社区成员重新设计的.

Languages

R, Python, c++, Julia, c#, Java, Perl, SAS, SQL

Tools

Jupyter, Git, PyCharm, CLion

Paradigms

Data Science, Management

Platforms

Linux, RStudio, VS Code,软件设计模式

Industry Expertise

Bioinformatics

Other

Machine Learning, Computational Biology, Data Analysis, Research, Bayesian Statistics, Statistical Modeling, Network Analysis, Graph Theory, Data Visualization, Artificial Intelligence (AI), Data Manipulation, Data Analytics, Large Data Sets, Statistics, Linear Algebra, Linear Optimization, Life Science, Probabilistic Graphical Models, Probability Theory, Data Scraping, 自然语言处理(NLP), Algorithms, Open Source, Genomics, Data Extraction, GPT, 生成预训练变压器(GPT), Molecular Biology, Strategy, Computer Vision, Business Cases, Deep Learning, Language Models, Biology, Fundraising

Libraries/APIs

自然语言工具包(NLTK), REST api, PyTorch

Frameworks

RStudio Shiny

2018 - 2022

PhD in Biostatistics

哥本哈根大学-哥本哈根,丹麦

2015 - 2017

信息学与应用数学硕士学位

St. 圣彼得堡理工大学. Petersburg, Russia

2011 - 2014

信息学和应用数学学士学位

南乌拉尔国立大学-车里雅宾斯克,俄罗斯

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

Top talent is in high demand.

Start hiring