Я ищу API обработки данных/параллельного программирования для Java.
Я знаю, что есть DataRush, но это не бесплатно. В частности, меня интересует многоядерная обработка данных, а не распределенная, которая исключает MapReduce или Hadoop.
Любые мысли?
Спасибо, РоллоAPI программирования потока данных для Java?
ответ
встроенные ли в Java concurrent пакета удовлетворить ваши потребности? Это очень хороший пакет, построенный в ThreadPools, CopyOnWriteCollections, Executors, Future. Мы используем его для обработки больших объемов данных в пулах потоков.
Возможно, появится новая версия fork/join, которая будет (надеюсь) находиться в Java 7 как часть обновления JSR 166y.
Главная страница проекта: - http://gee.cs.oswego.edu/dl/concurrency-interest/index.html
Указатели на множество ссылок о том, что это: - http://tech.puredanger.com/java7#jsr166
Вы можете попробовать gpars; он, по-видимому, реализует переменные потока данных и потоки в Java, хотя он ориентирован на предоставление параллельных программных свойств для Groovy.
https://github.com/rfqu/df4j простой, но мощный библиотека данных потока. Если у него не хватает некоторых желаемых функций, их можно легко добавить. Он может использовать java.concurrent.ExecutorService.
[Akka] (http://doc.akka.io/docs/akka/1.3.1/java/dataflow.html) имеет возможности потока данных. – thSoft 2012-10-26 08:52:11