Reduce import scopes, remove cycles.
[python_utils.git] / parallelize.py
1 #!/usr/bin/env python3
2
3 """A decorator to help with dead simple parallelization."""
4
5 from enum import Enum
6 import functools
7 import typing
8
9 ps_count = 0
10 thread_count = 0
11 remote_count = 0
12
13
14 class Method(Enum):
15     THREAD = 1
16     PROCESS = 2
17     REMOTE = 3
18
19
20 def parallelize(
21         _funct: typing.Optional[typing.Callable] = None,
22         *,
23         method: Method = Method.THREAD
24 ) -> typing.Callable:
25     """Usage:
26
27     @parallelize    # defaults to thread-mode
28     def my_function(a, b, c) -> int:
29         ...do some slow / expensive work, e.g., an http request
30
31     @parallelize(method=Method.PROCESS)
32     def my_other_function(d, e, f) -> str:
33         ...do more really expensice work, e.g., a network read
34
35     @parallelize(method=Method.REMOTE)
36     def my_other_other_function(g, h) -> int:
37         ...this work will be distributed to a remote machine pool
38
39     This decorator will invoke the wrapped function on:
40
41         Method.THREAD (default): a background thread
42         Method.PROCESS: a background process
43         Method.REMOTE: a process on a remote host
44
45     The wrapped function returns immediately with a value that is
46     wrapped in a SmartFuture.  This value will block if it is either
47     read directly (via a call to result._resolve) or indirectly (by
48     using the result in an expression, printing it, hashing it,
49     passing it a function argument, etc...).  See comments on the
50     SmartFuture class for details.
51
52     Note: you may stack @parallelized methods and it will "work".
53     That said, having multiple layers of Method.PROCESS or
54     Method.REMOTE may prove to be problematic because each process in
55     the stack will use its own independent pool which may overload
56     your machine with processes or your network with remote processes
57     beyond the control mechanisms built into one instance of the pool.
58     Be careful.
59     """
60     def wrapper(funct: typing.Callable):
61
62         @functools.wraps(funct)
63         def inner_wrapper(*args, **kwargs):
64             import executors
65             import smart_future
66
67             # Look for as of yet unresolved arguments in _funct's
68             # argument list and resolve them now.
69             newargs = []
70             for arg in args:
71                 newargs.append(smart_future.SmartFuture.resolve(arg))
72             newkwargs = {}
73             for kw in kwargs:
74                 newkwargs[kw] = smart_future.SmartFuture.resolve(
75                     kwargs[kw]
76                 )
77
78             executor = None
79             if method == Method.PROCESS:
80                 executor = executors.DefaultExecutors().process_pool()
81             elif method == Method.THREAD:
82                 executor = executors.DefaultExecutors().thread_pool()
83             elif method == Method.REMOTE:
84                 executor = executors.DefaultExecutors().remote_pool()
85             assert executor is not None
86
87             future = executor.submit(funct, *newargs, **newkwargs)
88
89             # Wrap the future that's returned in a SmartFuture object
90             # so that callers do not need to call .result(), they can
91             # just use is as normal.
92             return smart_future.SmartFuture(future)
93
94         return inner_wrapper
95
96     if _funct is None:
97         return wrapper
98     else:
99         return wrapper(_funct)