Timo Klock,德国汉堡的开发者
Timo is available for hire
Hire Timo

Timo Klock

Verified Expert  in Engineering

Machine Learning Developer

Location
Hamburg, Germany
Toptal Member Since
September 13, 2021

Timo是一名全栈数据科学家,在数据密集型应用程序方面拥有8年的专业经验,拥有机器学习和统计学博士学位. 他可以作为数据工程师在工业应用程序的数据生命周期中担任不同的角色, data scientist, ML engineer, or data analyst. Timo在Python和SQL以及许多现代数据框架方面经验丰富.

Portfolio

Legal Tech Scaleup
数据科学,机器学习操作(MLOps), Python, SQL,雪花...
房地产分析平台
数据科学,Python,数据工程,SQL, Apache气流...
Simula Consulting
数据科学,数据分析,数据工程,优化,OptaPlanner...

Experience

Availability

Part-time

Preferred Environment

Python, Machine Learning, Operations Research, Applied Mathematics, Cloud, Containers, Relational Databases, SQL, Warehouses, 机器学习操作(MLOps)

The most amazing...

...我参与的项目是为一家小型初创公司从零开始建立一个商业房地产分析数据平台.

Work Experience

数据科学家,机器学习工程师

2023 - PRESENT
Legal Tech Scaleup
  • 开发了一种数据驱动的领先评分算法,用于对即将提交的法律案件的质量进行分类.
  • 概念化和开发了可扩展的MLOps基础设施,它使用开源软件(OSS)和GCP中的无服务器基础设施简化了ML模型的开发和维护.
  • 开发了一个数据驱动的模型,用于对正在进行的法律案件进行评分,数据覆盖范围越来越好.
  • 在每两周的会议上告知利益相关者,如果计划在公司中更多地使用ML,那么建立MLOps基础设施的重要性.
  • 就与客户一般数据基础设施相关的问题进行咨询, 比如提高数据质量和数据覆盖率.
Technologies: 数据科学,机器学习操作(MLOps), Python, SQL,雪花, Prefect, MLflow, HyperOpt, Scikit-learn, Pandas, NumPy, XGBoost, AutoML, Google Cloud Platform (GCP), Google Cloud

Data Platform Engineer

2021 - PRESENT
房地产分析平台
  • 在谷歌云平台(GCP)上开发基于云的数据平台,为覆盖挪威市场的商业房地产分析平台提供动力.
  • 与产品团队一起研究数据源,为分析应用程序概念化和开发新功能.
  • 从提取中实现数据管道, including web scraping, API connections, 数据转储导入使用DBT转换web应用程序的数据.
  • 建立和维护自托管的气流基础设施,以调度数据管道和各种工作流程.
  • 使用分析应用程序为客户提供定制的数据集,并通过Streamlit应用程序访问数据.
  • 使用Python的FastAPI框架实现和维护一个API, 为web应用程序开发人员提供无缝数据交付.
Technologies: 数据科学,Python,数据工程,SQL, Apache气流, Data Build Tool (dbt), Airbyte, ETL, ELT, Streamlit, FastAPI, REST, Google Cloud Platform (GCP), PostgreSQL, Elasticsearch, BigQuery, Docker Compose, Poetry, GitHub, Continuous Deployment, Continuous Integration (CI)

数据科学家,数据工程师

2020 - 2021
Simula Consulting
  • 在多个与数据科学相关的项目中担任技术顾问, machine learning, and optimization.
  • 开发挪威COVID-19跟踪应用程序Smittestopp的数据科学后端,用于根据蓝牙和GPS数据识别潜在感染者之间的联系.
  • 曾担任一家生物技术公司的数据工程师和分析师,参与发现治疗胆管癌侵袭性形式的新药.
  • 带领一个小型开发团队概念化并实现一个大型求解器,用于解决具有多个业务约束的车辆路线问题, 哪些是由公司的主要利益相关者定义的.
Technologies: 数据科学,数据分析,数据工程,优化,OptaPlanner, OR-Tools, Azure, Applied Mathematics, Python, Pandas, NumPy, Matplotlib, Dash, Plotly, GitHub, SQL, Predictive Modeling

Postdoc and PhD Student

2016 - 2021
Simula Research Laboratory
  • 撰写了10多篇文章,有助于对数据科学中常用方法的基本理解, machine learning, and AI. 论文均发表在国际知名期刊和会议上.
  • 撰写关于新的元启发式优化方法的文章,例如基于共识的优化.
  • 与圣地亚哥大学的顶尖研究人员建立了国际合作关系, Munich, Oslo, Genoa, and London.
  • 共同监督数据科学和机器学习项目的研究实习生和博士生.
  • 组织专题讨论会、讲习班、暑期学校和会议.
  • 在暑期学校和研讨会上教授机器学习方法的课程.
  • 向国际技术和非技术观众展示研究成果.
  • 对慕尼黑工业大学的数据科学和数学系进行了长期的研究访问, 巴尔的摩的约翰霍普金斯大学, 以及加州大学圣地亚哥分校.
技术:应用数学, Python, Data Science, Machine Learning, 人工智能(AI), Optimization, Metaheuristics, Pandas, Matplotlib, NumPy, Plotly, SciPy, Scikit-learn, Scikit-image, CVXOPT, Statistics, TensorFlow, PyTorch, Keras, Dimensionality Reduction, Clustering, Regression, Classification, Predictive Modeling

访问博士后学者

2019 - 2020
加州大学圣地亚哥分校
  • 对加州大学圣地亚哥分校数学系的生成模型和深度神经网络的基本理解做出了贡献.
  • 建立UCSD与奥斯陆Simula研究实验室之间的联系.
  • 共同撰写科学论文,并向更广泛的受众传播研究成果.
技术:应用数学, Python, Data Science, Machine Learning, 人工智能(AI), Optimization, Metaheuristics, Pandas, Matplotlib, NumPy, Plotly, SciPy, Scikit-learn, Statistics, TensorFlow, PyTorch, Keras, Regression, Classification

Intern and Student Trainee

2015 - 2016
OHB System AG
  • 在一家航天器制造商OHB系统公司的系统工程部做了6个月的全职实习生和6个月的兼职学生实习生.
  • 建立了在轨卫星反力轮微力发射的数学模型.
  • Performed data analysis, modeling, 并对在轨卫星反作用轮发出的力进行了可视化的综合研究.
  • 利用研究数据建立数学模型.
  • 共同撰写了一篇关于管理微振动对卫星性能影响的科学论文, 描述研究结果和开发的模型.
技术:MATLAB,数学建模,数据分析

Student Research Assistant

2011 - 2016
University of Bremen
  • 发展物理过程的数学模拟,如热扩散和应力应变模拟.
  • 实现了一个c++工具箱,用于求解具有质量守恒和接口重新初始化的水平集方程(传输方程).
  • 将水平集方法集成到基于扩展有限元和FEniCS软件框架的两相热方程求解器中.
  • 共同撰写了关于水平集方法和求解多相热方程的会议演讲和技术报告.
Technologies: MATLAB, ParaView, Mathematical Modeling, 偏微分方程, Applied Mathematics, Git, GitHub, Python

国家电晕跟踪应用程序的数据分析后端

该项目旨在开发一款移动冠状病毒追踪应用程序,以限制COVID-19疾病在挪威的传播. 它由挪威卫生部发布,由一个信息技术公司财团执行. 我是数据科学后端开发团队的一员, 在那里我们概念化和实现基于蓝牙和GPS数据的接触识别算法. 由于形势的紧迫性,开发环境非常敏捷. 该项目的主要挑战之一是设计一个高效的关系数据库, 它允许快速查询个人之间必要的联系数据,以应对高感染率时期的高计算需求. 其他挑战包括数据安全性,因为数据的敏感性,以及处理与蓝牙和GPS数据相关的不确定性.

药物发现分析数据分析师

该项目旨在发现新的个性化药物组合来治疗侵袭性癌症. 我的职责是开发一个数据管道,将几个试点研究的数据集成到一个数据库中(ETL和wrangling)。, 验证不同研究间数据的一致性, 并根据常用的药物相互作用模型确定最有希望的药物组合. Moreover, 我把结果告诉了公司的主要利益相关者, 为此,我使用Python Dash和Plotly框架开发了一个交互式仪表板.

面向物流规模化的车辆路径优化

该项目旨在概念化和实现一个受几个业务约束的大规模车辆路线求解器. 我领导着一个由3名开发者组成的团队, 负责将涉众需求转化为可操作的代码, 统筹发展进程, 并与公司的利益相关者沟通进展和结果. 该算法基于OptaPlanner软件框架和元启发式优化方法. 它允许在1-2小时的标准笔记本电脑计算时间内解决数千个实例的问题. We further used partitioning, multi-processing, 以及聚类技术,以提高求解器的效率,并从在更大的集群上运行中获益.

Libraries/APIs

Scikit-learn, NumPy, SciPy, Pandas, TensorFlow, Matplotlib, Keras, PyTorch, Flask-RESTful, PyMongo, PySpark, Kepler.gl, XGBoost

Paradigms

Data Science, 面向对象编程(OOP), 面向对象设计(OOD), ETL, 测试驱动开发(TDD), REST, Continuous Deployment, Continuous Integration (CI)

Storage

JSON, Azure Cosmos DB, NoSQL, MongoDB,关系数据库,PostgreSQL, Elasticsearch, Google Cloud

Other

Applied Mathematics, Predictive Modeling, Machine Learning, Statistics, Dimensionality Reduction, Clustering, Regression, Classification, Data Inference, Statistical Learning, Optimization, 人工智能(AI), Data Analysis, Data Engineering, Dash, Metaheuristics, CVXOPT, Mathematical Modeling, 偏微分方程, Data Modeling, Deep Learning, Data Analytics, Cloud, 关系数据库服务(RDS), OR-Tools, 自然语言处理(NLP), Computer Vision, OpenStreetMap, Operations Research, GPT, 生成预训练变压器(GPT), Containers, Warehouses, 机器学习操作(MLOps), Data Build Tool (dbt), Airbyte, ELT, FastAPI, Poetry, Prefect, MLflow, HyperOpt

Languages

Python, XML, YAML, SQL, R, Kotlin, HTML, CSS, Snowflake

Tools

MATLAB, Scikit-image, Plotly, GitHub, Git, OptaPlanner, ParaView, Pytest, Jira, Gradle, Jekyll, Azure App Service, Spark SQL, Apache Airflow, BigQuery, Docker Compose, AutoML

Platforms

谷歌云平台(GCP)、Docker、Azure、Azure PaaS、Databricks

Frameworks

Flask, Bootstrap, Apache Spark, JUnit, Streamlit

2016 - 2020

信息学与应用数学博士

奥斯陆大学-奥斯陆,挪威

2010 - 2016

计算数学硕士学位

不莱梅大学-不莱梅,德国

AUGUST 2021 - PRESENT

DP-900: Microsoft Azure数据基础

Microsoft

JUNE 2021 - PRESENT

Apache Spark (TM) SQL for Data Analysts

Coursera

MAY 2021 - PRESENT

深度学习专业化

Coursera

MAY 2016 - PRESENT

Machine Learning

Coursera

Collaboration That Works

How to Work with Toptal

在数小时内,而不是数周或数月,我们的网络将为您直接匹配全球行业专家.

1

Share your needs

在与Toptal领域专家的电话中讨论您的需求并细化您的范围.
2

Choose your talent

在24小时内获得专业匹配人才的简短列表,以进行审查,面试和选择.
3

开始你的无风险人才试验

与你选择的人才一起工作,试用最多两周. 只有当你决定雇佣他们时才付钱.

对顶尖人才的需求很大.

Start hiring