Главная / Дневники / Юрий Сиголаев / Запись
Новые алгоритмы линейной алгебры 22.09.2019 00:20
23.08.2007
15:40
Мною разработан новый комплекс алгоритмов диагонализации плотных вещественных симметричных матриц. Этот комплекс (SDIAG) имеет ряд важных преимуществ по сравнению с другими известными пакетами, в которых реализованы алгоритмы диагонализации:
1.заметное увеличение скорости расчетов;
2.значительная экономия оперативной памяти (шестикратный разрыв при нахождении всех собственных векторов и восьмикратный при нахождении части собственных векторов между всеми точными быстродействующими современными методами диагонализации и предложенными мною алгоритмами).
Идея этой разработки основывается на значительно возросшей скорости процессоров при значительных ограничениях на объемы оперативной памяти, а также на неудовлетворительных результатах современных пакетов, в которых реализованы алгоритмы диагонализации.
Новый алгоритм частично основан на исходном коде из замечательного пакета LAPACK. Сравнение производилось с известным пакетом Intel MKL, т.к. в нем реализованы алгоритмы из LAPACK'а.

Достигнуты следующие результаты:
1. Найден новый подход к решению алгебраической проблемы собственных значений и собственных векторов для трехдиагональных матриц, который позволил увеличить скорость и привел к значительной экономии оперативной памяти.
2. Разработан новый алгоритм матричного умножения, который позволил увеличить скорость перехода от матрицы собственных векторов трехдиагональной матрицы к матрице собственных векторов исходной матрицы.
3. Модифицирован алгоритм Pal-Walker-Kahan'а, который позволил увеличить скорость нахождения собственных значений трехдиагональной матрицы в несколько раз в случае медленной сходимости.
4. Применены блочные методы к упакованным матрицам, что привело к увеличению скорости трехдиагонализации упакованных матриц почти в 3 раза и к увеличению скорости перехода от матрицы собственных векторов трехдиагональной матрицы к матрице собственных векторов исходной упакованной матрицы в 8 раз.
5. Усовершенствованная реализация базовых алгоритмов линейной алгебры позволила увеличить скорость BLAS2 (IA32 и EM64T) и BLAS3 (IA32).
Например, скорость моей диагонализации на одном ядре превышает скорость самых быстрых и надежных алгоримов диагонализации Intel MKL на двух ядрах и позволяет диагонализировать плотную вещественную симметричную матрицу 31000*31000 с 4 GB RAM памяти для EM64T и 22000*22000 с 2 GB RAM памяти для IA32.
Применение разработанного алгоритма диагонализации описано в
публикациях [9-11], опубликованных на странице, посвященной процессору P4: http://www.thesa-store.com/products

Ответить предыдущая | следующая

КОММЕНТАРИИ:

24.08.2007 00:06#
putnik
Новые алгоритмы линейной алгебры
> 5. Усовершенствованная реализация базовых алгоритмов линейной алгебры позволила увеличить скорость BLAS2 (IA32 и EM64T) и BLAS3 (IA32).
Например, скорость моей диагонализации на одном ядре превышает скорость самых быстрых и надежных алгоримов диагонализации Intel MKL на двух ядрах...


05.08.2007 вы написали, что фирма Intel не оценила ваше предложение...
Может AMD реализует ваши идеи в "железе"? :-)

Ведь, если не они, то - кто?
IBM давно отошел от этих дел, а "Элементы" не разрабатывают CPU... :-)

По поводу общей "тормознутости" BLAS (BasicLinearAlgebraSubprograms) пишут уже давно... :-) Так что ваш результат, вполне в канве других аналогичных результатов... :-)
24.08.2007 10:28#
Новые алгоритмы линейной алгебры
>По поводу общей "тормознутости" BLAS ...
По поводу 2001 года ничего не могу сказать. Сейчас Intel MKL - это мощный пакет, за разработкой алгоритмов которого стоят известные математики (н-р, автор книги "Вычислительная линейная алгебра" Дж. Деммель). Этот пакет используется во многих известных программах, н-р, в квантовохимической программе GAUSSIAN (более 70% квантовохимических расчетов во всем мире проводится по этой программе). Что касается моих результатов, то, н-р, автор PC GAMESS Грановский (он предлагал мне включить мою диагонализацию в PC GAMESS) заподозрил меня в фальсификации результатов для BLAS LEVEL 3 (перемножение м-ц). И только после ознакомления с настройками BIOS'а (они выложены на моей странице) вынужден был признать реальность моих результатов. На "дворе" 21 век, а перемножать м-цы так и не научились.
>а "Элементы" не разрабатывают CPU ...
Кроме 4 и 5 пунктов у меня есть пункты 1-3, которые относятся к алгоритмам, а не к CPU. Это эквивалентно заявлению о том, что замечательная книга Дж. Х. Уилкинсона "Алгебраическая проблема собственных значений" также отностится к CPU.
Что касается дальнейшей судьбы моей диагонализации, то переговоры ведутся.
Архив | Дневники | Новости | Календарь
Вести дневник и оставлять комментарии могут только зарегистрированные пользователи
Логин:
Пароль:
Зарегистрироваться
Последние сообщения
Основные положения
Правила
Всего дневников: 764

Пользователей
в системе: 3386

Всего записей
и комментариев: 59465

Записей и комментариев
за последние 24 часа: 0
 ПОИСК ПОСТОВ
  по автору:
  по тексту:
 АКТИВНЫЕ ДНЕВНИКИ
 Все дневники  
e-mail: admin@arxiv.su       О проекте       RSS       Дизайны
©2009-2017 Архив. Все права защищены
Designed by tanyu6ka