Облачный сервис Google облегчает подготовку данных для машинного обучения
Появившийся в облаке Google Cloud сервис Dataprep упрощает задачу предварительной обработки данных для машинного обучения. По словам специалистов Google, он автоматически распознает схемы данных, соединения и аномалии наподобие отсутствующих или дублирующихся значений, не требуя программирования. После анализа Dataprep помогает составить набор правил обработки в формате Apache Streams для импорта в сервисы Google Cloud Dataflow, BigQuery и другие.
Сервис подготовки данных для машинного обучения пользуется им и сам - для выяснения, какие из правил оказываются наиболее полезными для заказчиков.
На конференции Google Cloud Next также было объявлено об улучшении сервиса BigQuery: добавлен механизм Commercial Datasets, позволяющий напрямую загружать для обработки в хранилище информацию с сайтов AccuWeather, Dow Jones, Xignite, HouseCanary и Remine. BigQuery теперь также может опрашивать Bigtable - облачную NoSQL-базу Google для приложений, требующих быстрого доступа к данным.
Еще два объявления - пользователи рекламных сервисов Google смогут отправлять в BigQuery их статистику для анализа; в сервисе Google Cloud SQL помимо PostgreSQL отныне доступны экземпляры MySQL.