Распределенные вычисления: проект Seti@home

Образец цитирования + Распределенные решения проблем хруста чисел

Есть много проблем, которые требуют большого количества хруста возможностей суперкомпьютеров. Например, вычисление Pi до n-го уровня точности, попытка взломать последний алгоритм шифрования, отображение генома человека или анализ радиоволн из космоса. Для некоторых приложений суперкомпьютера может быть недостаточно; и не каждый проект может себе это позволить. Однако, но с небольшим количеством умного программного обеспечения, примененного к интернету, есть решение.

Даже если вы провели много времени активно на работе, и ваш компьютер постоянно пытается идти в ногу, будут моменты, когда вы остановитесь на кофе, выскочите за бутербродом или что-то еще, где ваш компьютер ничего не делает.

Умножьте все это время простоя процессора на количество компьютеров, используемых сегодня, и у вас есть много вычислительной мощности, просто идущей впустую. Одним из аспектов «распределенных вычислений» является использование этого неиспользуемого процессорного времени для выполнения полезной работы. Используя это время простоя проекты могут синхронизировать годы времени обработки в днях.

Рост мощности этих типов приложений может быть напрямую связан с ростом Интернета.

SETI@home

Радиотелескопы наблюдают за небом на протяжении десятилетий, предоставляя астрономам более подробную картину Вселенной, чем оптические телескопы. Многие из полученных радиосигналов являются белым шумом (технически это коричневый шум, но звучит похоже), звуком космоса, излучениями от звезд, туманностей и других звездных тел. К радиоприемнику из-за пределов нашей Солнечной системы сама Земля посылает огромное количество радиоволн. Как и шум, который излучает наша планета, возможно, где-то будет радиошум с других планет. Шум, который может указывать на разумную жизнь.

Но как мы находим эти закономерности? Огромное количество радиоволн, которые разбиваются на НАШЕЙ ПЛАНЕТЕ каждый день, заняло бы столетия для анализа одним компьютером. (Действительно, к тому времени, когда он завершил свою работу, мы, вероятно, построили бы космические корабли, чтобы узнать себя!) Именно здесь может помочь мощь распределенных вычислений.

В течение последних 5 или 6 лет лаборатория космических наук Беркли выполняла проект SETI@home. SETI выступает за поиск внеземного разума, и проект посвящен поиску паттернов, которые могут быть признаками разумной жизни Среди в основном случайной массы радиосигналов, которые достигают Земли из космоса. Каждый участник проекта предлагает часть своего компьютерного времени на дело. Членство открыто для всех, кто имеет доступ к компьютеру и интернету. В настоящее время насчитывается 2 822 404 членов, и они набрали 582 977 лет времени обработки.

Когда вы присоединяетесь к проекту SETI, вы указываете имя пользователя в виде своей электронной почты и некоторые сведения о себе, а затем загружаете программное обеспечение. Проект автоматически назначает вам небольшую часть ночного неба, и вы сразу же начинаете поиск. Каждый раз, когда ваш компьютер простаивает программное обеспечение запускается в качестве заставки и начинает работать с данными. После того, как все загруженные данные были проанализированы, результаты загружаются на главный сервер SETI, и следующая часть данных загружается готовой для нового анализа. Каждый пакет данных составляет около 300K и загрузка и загрузка быстро.

У вас также есть возможность запускать программное обеспечение все время «в фоновом режиме». Я использовал 450MHZ PIII для приложений с интенсивным процессором выше среднего (манипулирование большими изображениями) с программным обеспечением SETI, работающим в фоновом режиме без заметной потери скорости. Программное обеспечение исключительно хорошо себя ведет, работает с низким приоритетом и отдает процессор всему, что требует этого. Он никогда не разбил машину (это осталось до Internet Explorer!).

Распределенные Решения

Время простоя настольного компьютера может составлять от нескольких минут до целого дня. Сложите это время простоя для каждого компьютера в мире, и это доходит до значительной суммы. Распределенные вычисления используют интернет, чтобы использовать мощь глобальной сети ПК, эффективно создавая один суперкомпьютер. Интересно думать, что этот суперкомпьютер не является мощным сам по себе, а скорее его мощность напрямую связана с количеством активных участников. («Активный» в самом широком смысле этого слова, так как все, что вам нужно сделать, это загрузить программное обеспечение и согласиться принять участие).

«Компьютер» имеет вычислительную мощность, которая является функцией количества «виртуального» времени, которое он имеет в своем распоряжении для работы над проблемой. Не важно, насколько быстр любой отдельный процессор — 50 компьютеров могут работать над разными частями одной и той же проблемы одновременно, решая ее в 50 раз быстрее, чем одна машина.

Фактически это означает, что разработчики распределенного программного обеспечения, как это создали мощный параллельный компьютер, где отдельные процессоры могут быть добавлены легко, каждый становится ячейкой целого. Можно ли провести аналогию между этими отдельными проводными компьютерами, подключенными через Интернет, и отдельными нейронами в человеческом мозге? Насколько мы далеки от написания распределенного параллельного кода, который может вести себя аналогично нейронам, создавая неизвестный тип интеллекта, который просто использует свободное время ПК для общения с другими нейронами для рассмотрения других проблем? Невидимый и молчаливый. Некоторые распределенные проекты пытаются смоделировать очень простую модель эволюции, в которой основная форма жизни хищника / жертвы разрабатывается в комплекте с мутациями и оставляется на поле боя, чтобы убивать, есть, быть съеденным и размножаться.

Распределенные вычисления также могут объединить единомышленников в виртуальное сообщество, где они работают над одним проектом и могут обмениваться идеями и решениями. SETI сами разработали рабочие группы для поощрения пользователей, с конкурсами и форумами чата. Космическое общество Университета Кента имеет активные группы пользователей и регулярно встречается в пабе. Есть интересный сайт по адресу http://www.pcfseti.co.uk/ где многие пользователи активно изучают идеи SETI.

Индивидуально результаты могут не иметь большого смысла, но коллективно большие сложные проблемы могут быть решены.

На момент написания статьи Самый мощный компьютер, IBM ASCI White, оценивается в 12 терафлопс и стоит $ 110 млн. SETI@home в настоящее время получает около 15 терафлопсов и до сих пор стоит $500 тыс.

В качестве студенческого проекта Pi теперь был рассчитан до квадриллиона (1 с 18 нулями) бит в течение 2-летнего проекта. В течение этих 2 лет объединенные усилия двух тысяч компьютеров по всему миру, набрали поразительные 600 лет времени обработки. Это эквивалент одного настольного ПК P90, постоянно работающего над этой единственной проблемой в течение 600 лет.

Это ПК, которые в противном случае ничего бы не делали.

Данные

Используемые данные поступают из сигналов, собранных с радиотелескопа, установленного в кратере спящего вулкана в Аресибо, в Мексике.

Область в фиолетовом на этой карте неба показывает области, покрытые до сих пор.

Есть еще очень много неба, чтобы сканировать. Так как у меня была заставка работает на моем компьютере, установленном на 23 февраля 2000 года, я набрал 3554 часов процессорного времени – это около 150 дней, и мой компьютер в настоящее время анализирует данные из региона в 18 часов 8 минут 42 сек, 17 град, 46’ 12’, записанные в среду 20 декабря 2000 года в 17:35.17. Это регион в созвездии Змееносца на карте выше (обозначен ‘ Oph’), собранный в декабре прошлого года.

Анализ

Когда программное обеспечение SETI работает это то, что вы видите на экране.

Это не очень захватывающая заставка, но она движется! Графики фактически являются спектрами мощности анализируемых областей, и по мере выполнения анализа они обновляются автоматически.

Эта заставка фактически выполняет преобразования Фурье для данных. Это метод, который отделяет составляющие частоты от сигнала, чтобы предоставить некоторую информацию о его структуре. В частности, программное обеспечение ищет шипы и Гауссовские колокола.

Спайки: — Спайк-это частота со значительно высокой амплитудой. Они измеряются для обеспечения правильной работы программного и аппаратного обеспечения, но также могут обеспечить интересные шаблоны.

Гаусса колокола: — этот анализ предполагает, что далекий (чужой) передатчик посылает какой-то сигнал. Сигналы от этого передатчика должны становиться сильнее и слабее, поскольку регистрирующий телескоп перемещается над этой точкой в небе. Это измеряется как увеличение мощности, а затем уменьшение, которое имеет очень характерную форму, известную в математике как гауссовский колокол, так как он выглядит примерно Колокольной формы. (В верхней части колокола самый сильный сигнал, затухающий до краев.)

SETI использует статистический метод (известный как Хи-квадрат), который возвращает высокое или низкое число, в зависимости от того, насколько близки данные к соответствию гауссовой форме колокола. Чем ниже значение, тем ближе данные соответствуют гауссовскому колоколу, увеличивая важность этого местоположения неба.

Например, если подобный проект выполняется на распределенных компьютерах на планете, вращающейся вокруг Альфа-Центури, может не пройти много времени, прежде чем они увидят форму гауссовского колокола, сосредоточенную над нашей Солнечной системой.

На момент написания статьи ничего не было найдено, но они (и мы) все еще ищут и все еще надеются.

Примечание: 1 шифровальные компании часто ставят крупномасштабные задачи в интернете, чтобы увидеть, насколько безопасны их методы шифрования. Некоторые единомышленники выполнили одну из этих задач, используя распределенное использование процессорного времени, как описано в статье. Было бы неудивительно обнаружить подобные, незаконные проекты, работающие над расшифровкой кода таким образом. Интересно, что вирус потенциально может функционировать во многом так же, как SETI@home screensaver, только держать себя скрытым. примечание: 2 Эта статья была написана на ПК Pentium III 450Mhz, который довольно медленный по сравнению с настольными ПК, доступными сегодня, но когда я печатаю свой обработчик, он никогда не превышает 5% использования. Когда я запускаю Excel и открываю свой график для редактирования, есть заглядывания около 30%, и даже сайт Flash intensive AtomFilms управляет только взглядом на 100%, прежде чем вернуться к примерно 4%. Потоковое видео с того же сайта простаивает на 5%. Короче говоря, в повседневном использовании процессор моей машины сильно недоиспользуется. (Попробуйте это сами и посмотрите, сколько процессорной мощности вы используете в течение дня). Примечание: 3 Вы можете рассматривать » флоп’ как одно вычисление-FLOP-FLOating Point calculation. В этом случае FLOPS означает вычисление с плавающей запятой в секунду. Таким образом, 1 TerraFLOPs-это более триллиона вычислений с плавающей запятой в секунду.

http://www.ariadne.ac.uk/issue27/seti

Ссылка на основную публикацию